สถิติจากข้อมูลของ GenZ ในบทบาทของ Data Science และ ML

สถิติจากข้อมูลของ GenZ ในบทบาทของ Data Science และ ML

Generation Z, GenZ หรือถูกเรียกว่ารุ่นที่เป็น Zoomers คือ Generation ที่เกิดระหว่างปี 1997-2012 (สำหรับบางค่ายระบุว่าเกิดระหว่างปี 1990-2010 ค่ะ) คนรุ่นนี้เกิดมาพร้อมกับข้อมูลจำนวนมหาศาล และการเข้าถึงเทคโนโลยี ทำให้ลักษณะเฉพาะของเหล่า Zoomers ถูกนำมาวิเคราะห์และพูดถึงอย่างมาก ทั้งในแง่ของการตลาด เพื่อการนำเสนอผลิตภัณฑ์ และโฆษณาที่สอดคล้องเพื่อสร้างแรงจูงใจ กระตุ้นการซื้อ

ในบทความนี้นิกจะพาเพื่อนๆ ในทำความรู้จักกับ Generation Z ในอีกแง่มุมที่น่าสนใจ ในบทบาทและมุมมองของเหล่า Zoomers ที่มีต่อเรื่องวิทยาศาสตร์ข้อมูล (Data Science: DS) และการเรียนรู้ของเครื่อง (Machine Learning: ML) รวมไปถึงเรื่องของปัญญาประดิษฐ์ (AI)

ซึ่งจากการที่ Generation Z คุ้นชินกับการรับข้อมูลจำนวนมหาศาลต่อวัน และอยู่ท่ามกลางการเปลี่ยนแปลงอย่างรวดเร็วของเทคโนโลยี ทำให้มุมมองต่อ DS และ ML มีความพิเศษ แตกต่างจากคนใน Generation อื่น โดยข้อมูลที่จะนำมาวิเคราะห์กันในบทความนี้ เป็นข้อมูลผลสำรวจด้าน DS และ ML ประเภท .CSV ไฟล์ ซึ่งจะใช้ร่วมกับโปรแกรมภาษา Python บน Google Colab ค่ะ 😎☺

#1 การนำเข้าและการวิเคราะห์ข้อมูลเบื้องต้น

โดยจะเริ่มจากการนำเข้าข้อมูลเพื่อนำมาวิเคราะห์ ที่จะใช้ความสามารถของ lib pandas ในการอ่าน data ที่เป็น .csv เข้ามาเลย ผ่านคำสั่ง read_csv(‘path ของไฟล์’) และเอามาเก็บไว้ที่ตัวแปรที่ชื่อว่า data

ซึ่งเมื่อเราทำการนำเข้าข้อมูลเรียบร้อยแล้ว สิ่งที่เราจะทำเป็นลำดับต่อไปก็คือการทำ Data Cleaning ค่ะ เนื่องจากพอเรานำข้อมูลมาแสดงในรูปแบบ dataframe ตามภาพด้านล่าง จะพบว่ามีข้อมูลในหลาย column มีค่าเป็น NaN (Not a Number) ทำให้เราต้องจัดการข้อมูลให้สามารถใช้งานได้ก่อน

นอกจากนี้เรายังพบว่าบุคคลที่อยู่ในชุดของข้อมูลทั้งหมด มีช่วงอายุที่หลากหลาย ไม่เฉพาะแต่ Generation Z เท่านั้น เราจึงต้องทำการกรองเอาข้อมูลของช่วงอายุที่เราไม่สนใจออกไปค่ะ ซึ่งหลังจากที่เรากรองเอา Gen อื่นๆ ออกไปแล้วพบว่ายังคงเหลือข้อมูลจากเหล่า Zoomers ให้ servey คิดเป็น 36% จากข้อมูลทั้งหมด (โดยในส่วนนี้นิกใช้เป็นการทำ data.loc โดยกำหนดเป็นช่วงอายุค่ะ)

#2 วิเคราะห์ข้อมูลของ Generation Z

เมื่อผ่านการทำ Data Cleaning กรองเอาเฉพาะข้อมูลที่ต้องการใช้ออกมาแล้ว เราก็จะมาพิจารณาข้อมูลในส่วนของ Gen Z ซึ่งพบว่าจากข้อมูล survey ของ Zoomers ทั้งหมด เป็นผู้ชายที่ตอบแบบสำรวจ 79% เป็นผู้หญิงอีก 19% และไม่ต้องการระบุเพศอีก 2% โดยในกลุ่มนี้มีผู้ชายที่สนใจด้าน DS และ ML เทียบกับผู้หญิงในอัตราส่วน 4:1 และผลจาก survey นี้มาจาก Zoomers ชาวอินเดียมากถึง 49% ในขณะที่ประเทศอื่นๆ มีผู้เข้าร่วม survey เฉลี่ยอยู่ที่ 5% เท่านั้น!!!!

ในขณะที่ผลสำรวจด้านเรื่องการศึกษา และแผนการศึกษาในช่วงเวลา 2 ปี พบว่า 55% มีระดับการศึกษาปริญญาตรี และอีก 27.1% มีการศึกษาในระบบปริญญาโท ซึ่งถือเป็นตัวเลขที่น่าสนใจมากๆ หากเทียบกับ Generation อื่นๆ นอกจากนี้ยังพบว่ามี Zoomers อีกจำนวนหนึ่งที่ศึกษาองค์ความรู้จาก Platform ออนไลน์ต่างๆ โดยไม่เข้าเรียนในระบบการศึกษาแบบมหาวิทยาลัย

และเมื่อวิเคราะห์เจาะจงในส่วนของความสนใจในการศึกษาและการทำงานเกี่ยวกับด้าน Data science และ Machine Learning พบว่ามีสัดส่วนของ Generation Z ถึง 30% ที่กำลังทำงานเกี่ยวกับด้านนี้ และมีสัดส่วนของนักเรียนที่กำลังศึกษาอยู่คิดเป็น 55.3%

สถิติจากข้อมูลของ GenZ ในบทบาทของ Data Science และ ML

#3 วิเคราะห์ลักษณะการใช้งานด้าน DS และ ML

โดยโปรแกรมภาษาที่ได้รับความนิยมในการใช้งานสูงสุดเป็นอันดับแรกคือโปรแกรมภาษา Python (ซึ่งใช้ในการวิเคราะห์ข้อมูลในบทความนี้เช่นเดียวกันค่ะ^^) ซึ่งมีค่าสูงถึง 33.4% ในการใช้งานในงานของ DS และ ML ตามมาด้วยภาษา SQL, C++ และภาษา C

ทั้งนี้สิ่งที่น่าสนใจมากๆ ก็คือการที่ Gen Z มีประสบการณ์การ Coding มาแล้วสูงถึง 90% (โดยประสบการณ์การโค้ดอยู่ที่ขั้นต่ำ 1 ปี และสูงสุด 5 ปี) และส่วนที่ยังไม่เคยมีประสบการณ์การโค้ด มีแพลนที่จะศึกษาเพิ่มเติมในด้านนี้อีกด้วย ╰(*°▽°*)╯ซึ่งนั่นหมายความว่า ในอนาคตอันใกล้สำหรับชาว Zoomers จะไม่มีใครที่เขียนโปรแกรมไม่ได้เลย!!!!

โดย IDE (Integrated Developmet Environmaent) ที่ได้รับความนิยมคือ Jupyter notebook, VS code และ Pycharm ตามลำดับ นอกจากนี้หากเป็นระบบ Hosted notebook แพลตฟอร์มที่ได้รับความนิยมสูงสุดคือ Google Colab ซึ่งค่อนข้างใช้งานได้สะดวกในการรันโปรแกรมภาษา Python (สอดคล้องกับข้อมูลก่อนหน้าที่ระบุว่าโปรแกรมภาษาที่เป็นที่นิยมสูงสุดสำหรับ Generation Z คือโปรแกรมภาษา Python ค่ะ^^)

สถิติจากข้อมูลของ GenZ ในบทบาทของ Data Science และ ML
ข้อมูลการใช้งาน IDE และ Hosted Platform

ซึ่งจากการวิเคราะห์ข้อมูลเพิ่มเติมพบว่ามีการใช้งานโปรแกรมภาษา Python เพื่องานด้าน DS ใน 2 ลักษณะหลักคือ

  • การทำ Data Visualization โดย Lib ที่มีการใช้งานบ่อยคือ Matplolibs, Seaborns และ Plotly ตามลำดับ
  • การวิเคราะห์ข้อมูลโดยใช้ ML ซึ่ง Framework ที่ได้รับความนิยมในการใช้งานสร้าง ML Models ได้แก่ SKlearn, Tensorflow, Keras และ Pytorch
credit: https://jovian.com/aakashns/python-matplotlib-data-visualization

โดย ML Model ที่ถูกสร้างขึ้นเพื่อวิเคราะห์ข้อมูลบ่อยๆ ในงาน DS จากกลุ่มคน GenZ ได้แก่โมเดลต่างๆ ดังนี้ค่ะ^^

  • Linear/ Logistic Resression ซึ่งใช้งานในการทำ Forecasting โดยการสร้างสมการความสัมพันธ์ระหว่างตัวแปร หรือ Features กับผลลัพธ์ (Label) ที่เราต้องการ
  • Decision Tree ถูกใช้งานเป็น 2 ประเภทคือการทำ regression tree ในการทำ regression และ classification tree ในการทำ Classification ของข้อมูล
  • CNN (Convolution nn) มักใช้ในการทำการจำแนกภาพ (Image Classification)
  • RNN (Recurrent nn) เหมาะกับการใช้งานร่วมกับข้อมูลที่มีการ Update ตลอดเวลา โดยมีลักษณะการทำงานที่นำ output จาก state ก่อนหน้า มาร่วมเป็น input ด้วย
  • LLMs Model เช่น BERT GPT ที่ได้รับความสนใจเพิ่มสูงขึ้นจากการกระแสของ Generative AI อย่าง ChatGPT ที่ทำให้โมเดลภาษาขนาดใหญ่ได้รับความนิยมในการใช้ และถูกนำมาประยุกต์ใช้งานในด้าน DS ของคน Gen Z เพิ่มมากยิ่งขึ้น

#สรุปสถิติจากข้อมูล Generation Z ในบทบาทของ DS และ ML

จากข้อมูลที่ได้จาก survey พบว่า Gen Z มีการศึกษาและเข้าถึงเรื่องของการทำ Data Science ในจำนวนที่สูงมากกก จนเราสามารถ assume ได้เลยค่ะ ว่าเป็นเรื่องปกติของ Gen Z ที่จะทำการวิเคราะห์ข้อมูล โดยเฉพาะอย่างยิ่งในการทำ Data Visualization และยังมีบางส่วนที่มีความคุ้นเคยกับ ML models อีกด้วย

นอกจากนี้สิ่งที่น่าสนใจก็คือเรื่องของการเข้าถึงการศึกษา และองค์ความรู้ของชาว Zoomers ที่สามารถเข้าถึงการศึกษาในระดับมหาวิทยาลัยในจำนวนที่เพิ่มสูงขึ้น และเข้าถึงองค์ความรู้ที่ตัวเองสนใจได้อย่างหลายหลาย โดยไม่ยึดติดกับลักษณะการเรียนรู้แบบเดิม แต่เป็นในรูปแบบของการเรียนรู้เพื่อให้สามารถนำไปใช้งานตามที่ต้องการได้จริง

ทำให้ธุรกิจการสอน หรือคอร์สเรียนต่างๆ ที่ตอบโจทย์การเรียนรู้ในลักษณะดังกล่าวเป็นที่ต้องการมากยิ่งขึ้น โดยเฉพาะการเรียนในรูปแบบออนไลน์

Panaya Sudta

Hi, I am Nick,,,,Panaya Sudta (●'◡'●) Engineer during the daytime. Researcher at night. Reader in spare time. (❁´◡`❁) วิศวกร/นักวิจัย และเป็นน้องใหม่ของการตลาดวันละตอน ในการทำ Market research ค่ะ หวังเป็นอย่างยิ่งว่าจะได้แชร์มุมมองกันนะคะ

Leave a Reply

Your email address will not be published. Required fields are marked *