Time Series Data ฉบับเข้าใจง่าย และ ML Models เพื่อทำการพยากรณ์
สวัสดีค่าาา เพื่อนๆ ในบทความนี้นิกจะมาต่อกันในส่วนของบทความที่ค้างทุกท่านไว้เมื่อสัปดาห์ที่แล้วที่จะมาชวนทำความเข้าใจลักษณะของข้อมูลประเภทหนึ่งที่สำคัญมากๆ สำหรับการวิเคราะห์ข้อมูลของทั้ง User ของแพลตฟอร์ม หรือลูกค้า ตลอดจนข้อมูลใดๆ ก็ตามที่มีความเกี่ยวเนื่องกับช่วงเวลาที่พวกเราเรียกกันว่าข้อมูลประเภท Time Series Data นั่นเองค่ะ^^
เนื่องจากข้อมูลทางธุรกิจนั้นมีการเปลี่ยนแปลงตลอดเวลา ร่วมกับการแข่งขันที่สูง ส่งผลให้ผู้นำองค์กรหรือนักการตลาดอย่างพวกเรา ต้องคิดค้นหากลยุทธ์ หรือแคมเปญจ์ใหม่ๆ ตลอดเวลา โดยเทคนิคอย่างหนึ่งที่ใช้ช่วยในการควบคุมการดำเนินการในปัจจุบัน และถูกนำมาใช้ในการวางแผนความต้องการในอนาคตหรือการทำ Forecasting ค่ะ ซึ่งนิกขอขยายความว่าการทำ Forecasting คือการคาดการณ์เหตุการณ์ในอนาคต เช่น การพยากรณ์ยอดขายสินค้าของตนเอง, พยากรณ์อัตราดอกเบี้ยเงินกู้, พยากรณ์ราคาสินค้าของคู่แข่ง, พยากรณ์ปริมาณการใช้วัตถุดิบ เป็นต้น
โดยการทำ Forecasting สามารถทำได้หลายวิธีด้วยกัน ขึ้นอยู่กับลักษณะของข้อมูล โดยในบทความนี้นิกจะพาทุกท่านไปทำความเข้าใจข้อมูลประเภท Time Series Data เพื่อการทำ Forecasting ในอนาคตค่ะ,,,, Let’s go 🤗🎑
Time Series Data คืออะไร?
Time Series Data หรือที่เรียกในภาษาไทยแบบเท่ๆ ว่า “อนุกรมเวลา” 🕑 คือ ข้อมูลที่เปลี่ยนแปลงไปตามเวลา เช่น ค่าเงินบาทไทยเทียบกับสหรัฐอเมริกา, ราคาหุ้น, ยอดขายของสินค้ารายวัน, จำนวนสินค้าที่ผลิตได้ในแต่ละเดือน, ข้อมูลรายได้ประชาชาติรายปี หรือข้อมูลการเข้าถึงและใช้งานแพลตฟอร์มต่างๆ เป็นต้น
โดยความแตกต่างของข้อมูลแบบ Time Series กับข้อมูลทั่วไป คือ ข้อมูลแบบ Time series นั้นมีฟีเจอร์ที่เราต้องพิจารณาที่เกี่ยวเนื่องกับ เวลา อย่างชัดเจน ดังนี้
- แนวโน้ม (Trend) คือ การเคลื่อนไหวของข้อมูลที่ต่อเนื่องกันในระยะยาวอย่างชัดเจน ไม่ว่าจะขึ้นหรือลง และลักษณะแนวโน้ม นั้นอาจจะมีแนวโน้มเป็นเส้นตรงหรือเส้นโค้งก็ได้
- ฤดูกาล (Seasonal) คือ การเปลี่ยนแปลงของข้อมูลที่เกิดขึ้นเนื่องจากอิทธิพลของ ฤดูกาล หรือช่วงเวลา ซึ่งจะเกิดขึ้นในช่วงเวลาเดียวกันซ้ำๆ อาจจะเป็น รายเดือน รายไตรมาส หรือรายปีก็ได้
- วัฏจักร (Cyclical) คือ การเคลื่อนไหวของข้อมูลที่มีลักษณะวนซ้ำ คล้ายกับ Seasonal แต่มีระยะเวลารอบนานกว่า เช่น 4 ปี หรือ 10 ปี
- ความผิดปกติ (Irregular) คือ เป็นเหตุการณ์ที่ผิดไปจากปกติ การเคลื่อนไหวของข้อมูลที่ไม่มีรูปแบบแน่นอน หรือเกิดขึ้นโดยไม่ได้มีการคาดการณ์ไว้ล่วงหน้า
ซึ่งจากลักษณะของข้อมูลแบบอนุกรมเวลานี่เองค่ะ ที่มีฟีเจอร์ดังกล่าวนี่เองค่ะ ที่เราจะนำมาทำการพยากรณ์หรือ Forecast กันต่อ โดยในบทความนี้นิกขอเล่าให้อ่าน ถึง AI Model ที่เหมาะกับการทำ Forecasting สำหรับข้อมูลประเภทนี้เพื่อเป็นตัวอย่างร่วมกับการทำ Optimization สำหรับโมเดลนั้น คือ LSTM และ GA ตามรายละเอียดดังต่อไปนี้ค่ะ
LSTM (Long Short-Term Memory) สำหรับ Time Series Data
Long Short Term Memory หรือ LSTM คือ โมเดล Deep learning ที่สร้างขึ้นมาจากการจำลองรูปแบบความจำของคน (memory) ที่มีความจุในการเก็บความทรงจำอยู่จำกัด ซึ่งเมื่อมีเหตุการณ์ใหม่ๆ เข้ามา สมองจะต้องเลือกที่จะ รับ หรือ ไม่รับเหตุการณ์ใหม่เข้ามาในความทรงจำ โดยเลือกจากความสำคัญของเหตุการณ์ และเมื่อสมองเลือกที่จะรับเหตุการณ์ใหม่ๆ ที่มีความสำคัญเข้ามาเก็บไว้ในระบบความทรงจำแล้ว (memorize) ก็จำเป็นที่จะต้องมีเหตุการณ์บางอย่างในอดีตถูกลืมทิ้งไปนั่นเอง (forget) ซึ่งลักษณะการทำแบบนี้เป็นส่วนหนึ่งที่ทำให้ LSTM เหมาะที่จะใช้วิเคราะห์ข้อมูลแบบ Time Series Data เพราะเหมาะสำหรับใช้ประมวลผลแบบลำดับ (Sequence) นั่นเอง
โดยในส่วนนี้เราสามารถนำมาจำแนกประเภท และพยากรณ์พฤติกรรมของผู้บริโภคได้ ดังนี้ค่ะ
- ทำ LSTM แบบ Classification เพื่อจำแนกประเภทของกลุ่มลูกค้าที่เราสนใจ
- ทำ LSTM แบบ Regression เพื่อ Predict ความเป็นไปได้ของยอดขาย และการใช้งานแพลตฟอร์มเป็นต้น
หลักการ Optimization ด้วย GA
Genetic Algorithm (GA): เป็นเทคนิคทางปัญญาประดิษฐ์อย่างหนึ่งที่ใช้ในการค้นหา, การเพิ่มประสิทธิภาพ และการเรียนรู้ (Search, Optimization, and Learning) ด้วยการเลียนแบบรูปแบบทฤษฎีวิวัฒนาการทางธรรมชาติของ ชาร์ลส์ ดาร์วิน ที่ได้กล่าวไว้ในทฤษฎี วิวัฒนาการว่า “สิ่งมีชีวิตที่อยู่รอดไม่ใช่สิ่งมีชีวิตที่แข็งแรงที่สุดแต่เป็นสิ่งมีชีวิตที่สามารถตอบสนองต่อการเปลี่ยนแปลงได้ดีที่สุด”
“It is not the strongest of the species that survive, nor the most intelligent, but the one most responsive to change.” -Charles Darwin
นั่นคือธรรมชาติจะคัดสรรยีนที่เหมาะสมเพื่อให้สิ่งมีชีวิตอยู่รอดและมีความสามารถในการแก้ปัญหามากขึ้นในรุ่นต่อๆไป (ที่มาของการใช้คำว่า Genetic)
เพื่อให้เห็นภาพได้ชัดเจนขึ้น เรามาดูตัวอย่างหลักการหัดเดินของน้องไดโนเสาร์ตามภาพด้านล่าง ที่เป็นตัวอย่างของการวิวัฒนาการในแต่ละ Generation ตามหลักการ GA กันค่ะ^^
ดังนั้น GA นั้นเหมาะสำหรับใช้กับการวิเคราะห์ด้วยค่าพารามิเตอร์จำนวนมากๆ (นั่นคือเงื่อนไขของลักษณะข้อมูลแบบ Time Series เพื่อพยากรณ์หุ้นที่เรากำลังทำอยู่) เมื่อใส่ GA เข้าไปในระหว่างการทำ LSTM ตัว GA จะทำการค้นหาคำตอบที่ดีกว่าเดิม และช่วยในการ Optimize model ให้ทำงานได้มีประสิทธิภาพมากขึ้น เพื่อคัดเลือกค่าน้ำหนัก (Weight) ที่ตอบโจทย์ที่สุด
โดยเราจะนำ indicator ที่เกี่ยวข้องซึ่งเรากำหนดไว้สำหรับธุรกิจของเราร่วมกับ Feature มาเป็นส่วนนึงใน Parameter ร่วมกับการใช้ข้อมูลที่ผ่านมาในอดีต แล้วนำค่าแต่ละค่ามาคำนวณ และหาค่าความเหมาะสมที่มีโอกาสพัฒนาต่อไปได้ ในขณะที่คำตอบที่ไม่ดีจะโดนกำจัดทิ้ง ผ่านการสุ่มด้วยความน่าจะเป็นเป็นหลัก
GA จะช่วยหาทิศทางความเป็นไปได้สำหรับการพยากรณ์ความต้องการการซื้อ และแคมเปญจ์สำหรับลูกค้าที่จะให้ผลกำไรมากที่สุด ซึ่งอาจจะ stimulate ออกมาในเชิงกลยุทธ์ต่างๆ ในการใช้วิเคราะห์ และตอบสนองต่อลูกค้าค่ะ
สรุป Time Series data สำหรับงานด้านการตลาด
เพราะฉะนั้นในส่วนของการวิเคราะห์ข้อมูลแบบ Time Series โดย ML Model เป็นกระบวนการใช้โมเดลการเรียนรู้ของเครื่องเพื่อทำนายข้อมูลในอนาคต โมเดล ML สามารถเรียนรู้จากข้อมูลในอดีตและคาดการณ์แนวโน้มของข้อมูลในอนาคตได้อย่างดี ซึ่งจะแม่นหรือไม่ขึ้นอยู่กับการเลือกโมเดลที่เหมาะสมนั่นเองค่ะ
โดยงานด้านการตลาดจำนวนมากเกี่ยวข้องกับข้อมูลแบบ Time Series เช่น ยอดขาย แคมเปญการตลาด และพฤติกรรมของลูกค้า ซึ่งมีรายละเอียดดังนี้
- คาดการณ์ยอดขาย: การวิเคราะห์ข้อมูลแบบ Time Series โดย ML Model สามารถช่วยนักการตลาดคาดการณ์ยอดขายในอนาคต ซึ่งช่วยให้นักการตลาดวางแผนกลยุทธ์การตลาดได้อย่างมีประสิทธิภาพ
- ประเมินประสิทธิภาพแคมเปญการตลาด: การวิเคราะห์ข้อมูลแบบ Time Series โดย ML Model สามารถช่วยนักการตลาดประเมินประสิทธิภาพแคมเปญการตลาดที่ผ่านมา ซึ่งช่วยให้นักการตลาดปรับปรุงแคมเปญการตลาดในอนาคต
- เข้าใจพฤติกรรมของลูกค้า: การวิเคราะห์ข้อมูลแบบ Time Series โดย ML Model สามารถช่วยนักการตลาดเข้าใจพฤติกรรมของลูกค้า ซึ่งช่วยให้นักการตลาดพัฒนาผลิตภัณฑ์และบริการที่ตอบสนองความต้องการของลูกค้าได้ดีขึ้น
เทคนิคการวิเคราะห์ข้อมูลแบบ Time Series โดย ML Model ที่นิยมใช้ในงานด้านการตลาด (นอกจากที่เล่าแบบละเอียดไปก่อนหน้า) ได้แก่
- ARIMA: ARIMA เป็นโมเดลการเรียนรู้ของเครื่องแบบไม่เชิงเส้นที่มักใช้สำหรับการวิเคราะห์ข้อมูลแบบ Time Series
- Prophet: Prophet เป็นโมเดลการเรียนรู้ของเครื่องแบบเชิงเส้นที่มักใช้สำหรับการวิเคราะห์ข้อมูลแบบ Time Series ที่มีแนวโน้มและวัฏจักร
Hope you all Enjoy ka (❁´◡`❁)