Time Series Data ฉบับเข้าใจง่าย และ ML Models เพื่อทำการพยากรณ์

Time Series Data ฉบับเข้าใจง่าย และ ML Models เพื่อทำการพยากรณ์

สวัสดีค่าาา เพื่อนๆ ในบทความนี้นิกจะมาต่อกันในส่วนของบทความที่ค้างทุกท่านไว้เมื่อสัปดาห์ที่แล้วที่จะมาชวนทำความเข้าใจลักษณะของข้อมูลประเภทหนึ่งที่สำคัญมากๆ สำหรับการวิเคราะห์ข้อมูลของทั้ง User ของแพลตฟอร์ม หรือลูกค้า ตลอดจนข้อมูลใดๆ ก็ตามที่มีความเกี่ยวเนื่องกับช่วงเวลาที่พวกเราเรียกกันว่าข้อมูลประเภท Time Series Data นั่นเองค่ะ^^

เนื่องจากข้อมูลทางธุรกิจนั้นมีการเปลี่ยนแปลงตลอดเวลา ร่วมกับการแข่งขันที่สูง ส่งผลให้ผู้นำองค์กรหรือนักการตลาดอย่างพวกเรา ต้องคิดค้นหากลยุทธ์ หรือแคมเปญจ์ใหม่ๆ ตลอดเวลา โดยเทคนิคอย่างหนึ่งที่ใช้ช่วยในการควบคุมการดำเนินการในปัจจุบัน และถูกนำมาใช้ในการวางแผนความต้องการในอนาคตหรือการทำ Forecasting ค่ะ ซึ่งนิกขอขยายความว่าการทำ Forecasting คือการคาดการณ์เหตุการณ์ในอนาคต เช่น การพยากรณ์ยอดขายสินค้าของตนเอง, พยากรณ์อัตราดอกเบี้ยเงินกู้, พยากรณ์ราคาสินค้าของคู่แข่ง, พยากรณ์ปริมาณการใช้วัตถุดิบ เป็นต้น

โดยการทำ Forecasting สามารถทำได้หลายวิธีด้วยกัน ขึ้นอยู่กับลักษณะของข้อมูล โดยในบทความนี้นิกจะพาทุกท่านไปทำความเข้าใจข้อมูลประเภท Time Series Data เพื่อการทำ Forecasting ในอนาคตค่ะ,,,, Let’s go 🤗🎑

Time Series Data คืออะไร?

Time Series Data หรือที่เรียกในภาษาไทยแบบเท่ๆ ว่า “อนุกรมเวลา” 🕑 คือ ข้อมูลที่เปลี่ยนแปลงไปตามเวลา เช่น ค่าเงินบาทไทยเทียบกับสหรัฐอเมริกา, ราคาหุ้น, ยอดขายของสินค้ารายวัน, จำนวนสินค้าที่ผลิตได้ในแต่ละเดือน, ข้อมูลรายได้ประชาชาติรายปี หรือข้อมูลการเข้าถึงและใช้งานแพลตฟอร์มต่างๆ เป็นต้น

โดยความแตกต่างของข้อมูลแบบ Time Series กับข้อมูลทั่วไป คือ ข้อมูลแบบ Time series นั้นมีฟีเจอร์ที่เราต้องพิจารณาที่เกี่ยวเนื่องกับ เวลา อย่างชัดเจน ดังนี้

  • แนวโน้ม (Trend) คือ การเคลื่อนไหวของข้อมูลที่ต่อเนื่องกันในระยะยาวอย่างชัดเจน ไม่ว่าจะขึ้นหรือลง และลักษณะแนวโน้ม นั้นอาจจะมีแนวโน้มเป็นเส้นตรงหรือเส้นโค้งก็ได้
  • ฤดูกาล (Seasonal) คือ การเปลี่ยนแปลงของข้อมูลที่เกิดขึ้นเนื่องจากอิทธิพลของ ฤดูกาล หรือช่วงเวลา ซึ่งจะเกิดขึ้นในช่วงเวลาเดียวกันซ้ำๆ อาจจะเป็น รายเดือน รายไตรมาส หรือรายปีก็ได้
  • วัฏจักร (Cyclical) คือ การเคลื่อนไหวของข้อมูลที่มีลักษณะวนซ้ำ คล้ายกับ Seasonal แต่มีระยะเวลารอบนานกว่า เช่น 4 ปี หรือ 10 ปี
  • ความผิดปกติ (Irregular) คือ เป็นเหตุการณ์ที่ผิดไปจากปกติ การเคลื่อนไหวของข้อมูลที่ไม่มีรูปแบบแน่นอน หรือเกิดขึ้นโดยไม่ได้มีการคาดการณ์ไว้ล่วงหน้า

ซึ่งจากลักษณะของข้อมูลแบบอนุกรมเวลานี่เองค่ะ ที่มีฟีเจอร์ดังกล่าวนี่เองค่ะ ที่เราจะนำมาทำการพยากรณ์หรือ Forecast กันต่อ โดยในบทความนี้นิกขอเล่าให้อ่าน ถึง AI Model ที่เหมาะกับการทำ Forecasting สำหรับข้อมูลประเภทนี้เพื่อเป็นตัวอย่างร่วมกับการทำ Optimization สำหรับโมเดลนั้น คือ LSTM และ GA ตามรายละเอียดดังต่อไปนี้ค่ะ

LSTM (Long Short-Term Memory) สำหรับ Time Series Data

Long Short Term Memory หรือ LSTM คือ โมเดล Deep learning ที่สร้างขึ้นมาจากการจำลองรูปแบบความจำของคน (memory) ที่มีความจุในการเก็บความทรงจำอยู่จำกัด ซึ่งเมื่อมีเหตุการณ์ใหม่ๆ เข้ามา สมองจะต้องเลือกที่จะ รับ หรือ ไม่รับเหตุการณ์ใหม่เข้ามาในความทรงจำ โดยเลือกจากความสำคัญของเหตุการณ์​ และเมื่อสมองเลือกที่จะรับเหตุการณ์ใหม่ๆ ที่มีความสำคัญเข้ามาเก็บไว้ในระบบความทรงจำแล้ว (memorize) ก็จำเป็นที่จะต้องมีเหตุการณ์บางอย่างในอดีตถูกลืมทิ้งไปนั่นเอง (forget) ซึ่งลักษณะการทำแบบนี้เป็นส่วนหนึ่งที่ทำให้ LSTM เหมาะที่จะใช้วิเคราะห์ข้อมูลแบบ Time Series Data เพราะเหมาะสำหรับใช้ประมวลผลแบบลำดับ (Sequence) นั่นเอง

โดยในส่วนนี้เราสามารถนำมาจำแนกประเภท และพยากรณ์พฤติกรรมของผู้บริโภคได้ ดังนี้ค่ะ

  1. ทำ LSTM แบบ Classification เพื่อจำแนกประเภทของกลุ่มลูกค้าที่เราสนใจ
  2.  ทำ LSTM แบบ Regression เพื่อ Predict ความเป็นไปได้ของยอดขาย และการใช้งานแพลตฟอร์มเป็นต้น

หลักการ Optimization ด้วย GA

Genetic Algorithm (GA): เป็นเทคนิคทางปัญญาประดิษฐ์อย่างหนึ่งที่ใช้ในการค้นหา, การเพิ่มประสิทธิภาพ และการเรียนรู้ (Search, Optimization, and Learning) ด้วยการเลียนแบบรูปแบบทฤษฎีวิวัฒนาการทางธรรมชาติของ ชาร์ลส์ ดาร์วิน ที่ได้กล่าวไว้ในทฤษฎี วิวัฒนาการว่า “สิ่งมีชีวิตที่อยู่รอดไม่ใช่สิ่งมีชีวิตที่แข็งแรงที่สุดแต่เป็นสิ่งมีชีวิตที่สามารถตอบสนองต่อการเปลี่ยนแปลงได้ดีที่สุด”

It is not the strongest of the species that survive, nor the most intelligent, but the one most responsive to change. -Charles Darwin

นั่นคือธรรมชาติจะคัดสรรยีนที่เหมาะสมเพื่อให้สิ่งมีชีวิตอยู่รอดและมีความสามารถในการแก้ปัญหามากขึ้นในรุ่นต่อๆไป (ที่มาของการใช้คำว่า Genetic)

เพื่อให้เห็นภาพได้ชัดเจนขึ้น เรามาดูตัวอย่างหลักการหัดเดินของน้องไดโนเสาร์ตามภาพด้านล่าง ที่เป็นตัวอย่างของการวิวัฒนาการในแต่ละ Generation ตามหลักการ GA กันค่ะ^^

ดังนั้น GA นั้นเหมาะสำหรับใช้กับการวิเคราะห์ด้วยค่าพารามิเตอร์จำนวนมากๆ (นั่นคือเงื่อนไขของลักษณะข้อมูลแบบ Time Series เพื่อพยากรณ์หุ้นที่เรากำลังทำอยู่) เมื่อใส่ GA เข้าไปในระหว่างการทำ LSTM ตัว GA จะทำการค้นหาคำตอบที่ดีกว่าเดิม และช่วยในการ Optimize model ให้ทำงานได้มีประสิทธิภาพมากขึ้น เพื่อคัดเลือกค่าน้ำหนัก (Weight) ที่ตอบโจทย์ที่สุด

โดยเราจะนำ indicator ที่เกี่ยวข้องซึ่งเรากำหนดไว้สำหรับธุรกิจของเราร่วมกับ Feature มาเป็นส่วนนึงใน Parameter ร่วมกับการใช้ข้อมูลที่ผ่านมาในอดีต แล้วนำค่าแต่ละค่ามาคำนวณ และหาค่าความเหมาะสมที่มีโอกาสพัฒนาต่อไปได้ ในขณะที่คำตอบที่ไม่ดีจะโดนกำจัดทิ้ง ผ่านการสุ่มด้วยความน่าจะเป็นเป็นหลัก

GA จะช่วยหาทิศทางความเป็นไปได้สำหรับการพยากรณ์ความต้องการการซื้อ และแคมเปญจ์สำหรับลูกค้าที่จะให้ผลกำไรมากที่สุด ซึ่งอาจจะ stimulate ออกมาในเชิงกลยุทธ์ต่างๆ ในการใช้วิเคราะห์ และตอบสนองต่อลูกค้าค่ะ

สรุป Time Series data สำหรับงานด้านการตลาด

เพราะฉะนั้นในส่วนของการวิเคราะห์ข้อมูลแบบ Time Series โดย ML Model เป็นกระบวนการใช้โมเดลการเรียนรู้ของเครื่องเพื่อทำนายข้อมูลในอนาคต โมเดล ML สามารถเรียนรู้จากข้อมูลในอดีตและคาดการณ์แนวโน้มของข้อมูลในอนาคตได้อย่างดี ซึ่งจะแม่นหรือไม่ขึ้นอยู่กับการเลือกโมเดลที่เหมาะสมนั่นเองค่ะ

โดยงานด้านการตลาดจำนวนมากเกี่ยวข้องกับข้อมูลแบบ Time Series เช่น ยอดขาย แคมเปญการตลาด และพฤติกรรมของลูกค้า ซึ่งมีรายละเอียดดังนี้

  • คาดการณ์ยอดขาย: การวิเคราะห์ข้อมูลแบบ Time Series โดย ML Model สามารถช่วยนักการตลาดคาดการณ์ยอดขายในอนาคต ซึ่งช่วยให้นักการตลาดวางแผนกลยุทธ์การตลาดได้อย่างมีประสิทธิภาพ
  • ประเมินประสิทธิภาพแคมเปญการตลาด: การวิเคราะห์ข้อมูลแบบ Time Series โดย ML Model สามารถช่วยนักการตลาดประเมินประสิทธิภาพแคมเปญการตลาดที่ผ่านมา ซึ่งช่วยให้นักการตลาดปรับปรุงแคมเปญการตลาดในอนาคต
  • เข้าใจพฤติกรรมของลูกค้า: การวิเคราะห์ข้อมูลแบบ Time Series โดย ML Model สามารถช่วยนักการตลาดเข้าใจพฤติกรรมของลูกค้า ซึ่งช่วยให้นักการตลาดพัฒนาผลิตภัณฑ์และบริการที่ตอบสนองความต้องการของลูกค้าได้ดีขึ้น

เทคนิคการวิเคราะห์ข้อมูลแบบ Time Series โดย ML Model ที่นิยมใช้ในงานด้านการตลาด (นอกจากที่เล่าแบบละเอียดไปก่อนหน้า) ได้แก่

  • ARIMA: ARIMA เป็นโมเดลการเรียนรู้ของเครื่องแบบไม่เชิงเส้นที่มักใช้สำหรับการวิเคราะห์ข้อมูลแบบ Time Series
  • Prophet: Prophet เป็นโมเดลการเรียนรู้ของเครื่องแบบเชิงเส้นที่มักใช้สำหรับการวิเคราะห์ข้อมูลแบบ Time Series ที่มีแนวโน้มและวัฏจักร

Hope you all Enjoy ka (❁´◡`❁)

Panaya Sudta

Hi, I am Nick,,,,Panaya Sudta (●'◡'●) Engineer during the daytime. Researcher at night. Reader in spare time. (❁´◡`❁) วิศวกร/นักวิจัย และเป็นน้องใหม่ของการตลาดวันละตอน ในการทำ Market research ค่ะ หวังเป็นอย่างยิ่งว่าจะได้แชร์มุมมองกันนะคะ

Leave a Reply

Your email address will not be published. Required fields are marked *