วิเคราะห์เทรนด์ผู้ฟัง ต่อยอดจาก Data ของ Spotify

วิเคราะห์เทรนด์ผู้ฟัง ต่อยอดจาก Data ของ Spotify

สวัสดีค่ะเพื่อนๆ วันนี้นิกจะมาเล่าอีกหนึ่งตัวอย่างที่น่าสนใจในการนำข้อมูลของ Spotify ที่เป็นผู้บริการสตรีมเพลงดิจิทัล พอดแคสต์ และวิดีโอ ซึ่งทำให้พวกเราเข้าถึงเพลงนับล้าน และเนื้อหาอื่นๆ จากศิลปินทั่วทุกมุมโลก ได้อย่างมีประสิทธิภาพ => ซึ่งคำว่ามีประสิทธิภาพนี่เองค่ะ ที่น่าสนใจ เพราะคือการใช้การทำ Data Analysis จากข้อมูลที่ถูกเก็บมาวิเคราะห์ และทำการตลาด

ทำความรู้จักกับข้อมูลจาก #Spotify for Developers

สำหรับชาว Dev Data Scientist และนักการตลาดที่ต้องการ Get API ของ Spotify มาใช้งาน ทาง provider ก็มี sevices ให้ค่ะ

โดยเพื่อนๆ สามารถเข้าไปดูข้อมูลที่เราต้องการได้จาก link: https://developer.spotify.com/documentation/web-api/reference/get-audio-features

ซึ่งสามารถเลือก Tracks ที่เราสนใจได้หลากหลาย เช่น Track’s Audio Feature หรือ Audio Analysis เป็นต้นค่ะ

โดยสิ่งที่เราสนใจ เป็นการวิเคราะห์เพื่อมองหา Audio Feature Trend ว่าเพลงแนวไหนมีแนวโน้มที่จะได้รับความนิยมมากขึ้น พร้อมกับการแสดงผลศิลปินและเพลงที่ได้รับความนิยม เพื่อนำเสนอเพลงให้ตรงกลุ่มเป้าหมาย และเป็นประโยชน์ในประเมินในการทำ Music Marketing เพื่อสร้างภาพลักษณ์ของแบรนด์ สำหรับนักการตลาด, Content Creators, ค่ายเพลง หรือแม้กระทั่งเรื่องของการเมืองค่ะ 🤓😆

(จริงๆ เรื่องนี้ต่อเนื่องจากการทำ Sentiment Analysis กับ Hijack Market ซึ่งเดี๋ยวนิกจะแปะ links ไว้ท้ายบทความค่ะ)

#Spotify Dataset

ทีนี้เรามาดูในส่วนของข้อมูลที่เราจะนำมาทำการวิเคราะห์กันค่ะ โดยในบทความนี้นิกใช้ชุดข้อมูล Spotify Dataset ซึ่งมีจำนวนข้อมูล Audio Features มากกว่า 600k+ Tracks จากศิลปินกว่า 1 ล้านคน ✨🔎

ซึ่ง Audio Features ที่เราดึงมาใช้งานจะมีรายละเอียดดังรูปด้านล่างค่ะ ^^

วิเคราะห์เทรนด์ผู้ฟัง ต่อยอดจาก Data ของ Spotify

#สร้างโครงสร้างของข้อมูลที่จะนำไปวิเคราะห์

แต่จาก Dataset ที่เราได้มายังไม่สามารถนำมาใช้งานได้ทันทีค่ะ ต้องผ่านการทำ Data Preparation ก่อน เนื่องจากอย่างที่นิกเคยบอกในบทความอื่นๆ ค่ะว่า Gabage in, Gabage out ถ้าข้อมูลไม่โอเค ผลวิเคราะห์ก็ไม่ดีเช่นกัน

โดยในบทความนี้จะใช้เป็นโปรแกรมภาษา Python บน Google colab ในการทำนะคะ^^ =>> มาเริ่มกันเลยยย ที่การ Import Lib ที่ใช้ก่อน ดังนี้ค่ะ

หลังจากกนั้นให้นำเข้า Dataset ที่เราจะใช้วิเคราะห์ ซึ่งรูปแบบของไฟล์จะเป็น file .CSV โดยเมื่อ Import files เข้ามาทั้งหมดแล้ว ให้ทำการ Merge files ให้อยู่ใน table เดียวกัน (ซึ่งจะไม่ Merge ก็ได้นะคะ แต่นิกคิดว่าถ้ารวมเป็นไฟล์เดียวน่าจะสะดวกกว่า) โดยใช้การ Join แบบ Left join ค่ะ

#Data cleansing & Transform

ในส่วนของการทำ Data cleansing สำหรับ Dataset นี้มี 4 หัวข้อที่ต้องทำดังนี้ค่ะ

  • Column “release_date” หรือวันที่ปล่อยเพลงออกมา มีหน้าตาของ fomat ข้อมูลไม่เหมือนกัน เช่น บาง rows มีรูปแบบ yyyy,mm,dd ในขณะที่หลาย rows เป็น yyyy,dd,mm โดยในบทความนี้เราจะวิเคราะห์เป็นรายปี เพราะฉะนั้นจึงปรับทั้งหมดให้กลายเป็นค่า “yyyy” ค่ะ
  • ตัดอักขระพิเศษในชื่อศิลปินออก เช่น [‘Robert Schmann’, ‘Vladimir Horowitz’] ที่จะทำการตัด [ ], ‘ และ , ออก
  • ตัด rows ที่มีค่า Loudness มีค่าเกิน 0 ออก (อ้างอิงค่าจากชาร์ต Variable definition ที่ Loudness จะมีค่าระหว่าง -60 ถึง 0)
  • ตัด rows ที่มีค่า Speechiness มากกว่า 0.66 ออก (จากที่พบว่าที่กราฟบางส่วนผิดปกติ จึงตรวจสอบด้วยการตรวจสอบจากชื่อเพลง และฟังว่าเป็นเพลงกลุ่มไหน พบว่ากลุ่มที่ผิดปกตินี้ไม่ใช่เพลง แต่เป็น Podcast ซึ่งมีค่ามากกว่า 0.66 (ถ้าเป็นเพลงจะมีค่า น้อยกว่า 0.66)

และทำ Data Transform ด้วยการเปลี่ยนค่าใน Column feature “key” ให้กลายเป็นสัญลักษณ์ระดับเสียงทางดนตรีแทนการเป็นตัวเลขแบบเดิม และเปลี่ยนหน่วยใน Column feature “duration_ms” (ซึ่งมีความละเอียดมากเกินไปเพราะเป็นมิลลิวินาที) ให้มีหน่วยเป็น minutes

เป็นอันเสร็จเรียบร้อยในเรื่องของการเตรียมข้อมูล ก่อนการนำไปวิเคราะห์ในหัวข้อถัดไปค่ะ

#วิเคราะห์เทรนด์ผู้ฟัง Spotify

เริ่มต้นจากการทำ Data Visualization เพื่อพิจารณาความสัมพันธ์ระหว่าง “ปี (Year)” กับ คาแรคเตอร์ของเพลง (Audio features: acousticness, danceability, energy, speechiness, liveness, valence) พบว่าแนวเพลงสาย Active อย่าง Energy ได้รับความนิยมมากขึ้นในช่วงหลัง ในขณะที่แนว acousticness ได้รับความนิยมน้อยลง ในขณะที่แนวเพลงอื่นๆ ได้รับความนิยมค่อนข้างเป็นไปในแนวทางคงที่

หลังจากนั้นลองวิเคราะห์ศิลปินที่ติด Top5 พบว่ามีอันดับดังนี้,,,,

  1. BTS แนวเพลง : KPOP, HIPHOPR&B, EDM ปล่อยเพลงมา 47 เพลง ได้รับความนิยม 34 เพลง
  2. Juice WRLD แนวเพลง: Hip Hop, Trap, Emo rapSoundCloud rap ปล่อยเพลงมา 40 เพลง ได้รับความนิยม 25 เพลง
  3. The weeknd แนวเพลง: R&B
  4. Bad bunny แนวเพลง: Latin, trap, ‎reggaeton
  5. Travis Scott แนวเพลง: Hip Hop, Trap, Alternative Hip Hop

ซึ่งในส่วนของ Popularity ในแต่ละเพลงของศิลปิน จากเกณฑ์การคัดเลือกศิลปินที่ได้รับความนิยมมากที่สุด 5 อันดับ จะพิจารณาจากศิลปินที่มีเพลงที่ได้รับค่า popularity เกิน 70 ขึ้นไป เพื่อคัดเฉพาะเพลงที่ได้รับความนิยมแบบโดดเด่นจริงๆ

ซึ่งเมื่อดูจากกราฟด้านบน จะเห็นชัดเลยว่า BTS ที่อยู่อันดับ 1 นั้น ไม่มีเพลงที่มีค่า popularity เกิน 80 เลย ในขณะที่อันดับ 2-4 มีจำนวนเพลงที่ได้ popularity เกิน 80 ทุกวง เลยเป็นคำถามว่าแล้วทำไมวง BTS มีเพลงที่ได้ค่า popularity >= 80 น้อยกว่า 3 เพลง แต่กลับคว้าอันดับ 1 ได้ 😏😏 ซึ่งคำตอบก็คือ BTS เพลงที่ได้ค่า popularity >70 มีมากถึง 34 เพลง จาก 47 เพลง ทำให้ได้คะแนนรวมเยอะกว่าทุกวงนั่นเองค่ะ

วิเคราะห์เทรนด์ผู้ฟัง ต่อยอดจาก Data ของ Spotify

และเรามาดูในส่วนของ audio features หรือแนวเพลงของ BTS กันต่อค่ะว่ามีคาแรคเตอร์ของเพลงเป็นแบบไหนบ้าง ซึ่งพบว่าเป็นแนว speechiness เป็นหลัก เช่นเดียวกับอันดับ 2-4 ที่เป็น Speechiness, Tempo, Danceability, Energy และ Liveliness

และเราจะลองนำทุกเพลงของศิลปิน Top 5 ที่ได้จาก Spotify Dataset มาพิจารณาเพื่อดูว่า Character ของเพลงประจำตัวของศิลปินดังกล่าวมีลักษณะเป็นอย่างไร ได้ดังรูปด้านล่างค่ะ

ซึ่งจากกราฟพบว่า Audio features ที่มีเยอะที่สุดมีคาแรคเตอร์เป็น speechiness หรือเป็นเพลงที่มีเนื้อเพลง เป็นคำพูด รองลงมาก็จะเป็น Liveliness, Energy, danceability และ Tempo โดยสรุปภาพรวมได้ดังตารางค่ะ

และหากเพื่อนๆ ท่านไหนอยากลองเข้าไปดูในส่วนของโค้ดสามารถเข้าไปที่ Code ได้เลยค่ะ

#สรุป&วิเคราะห์

จากข้อมูลที่ Spotify จัดเก็บและ provide ให้พวกเราได้ใช้กัน จะเห็นว่าค่อนข้างเป็นข้อมูลที่มีคุณภาพ และมีประโยชน์ ซึ่งแม้แต่ Spotify เองยังมีการใช้ Dataset ข้อมูลของตัวเองในการขับเคลื่อนแคมเปญต่างๆ ด้วย

โดยบทความนี้เป็นหนึ่งในไอเดียที่จะข้อมูลของ Spotify มาวิเคราะห์หาแนวเพลงที่กำลังเป็นที่นิยมในมุมมองของผู้ฟัง ซึ่งจะมีประสิทธิภาพหากเราตั้งคำถาม และตามหาสิ่งที่ต้องการจะวิเคราะห์ได้ เพื่อเป็นแนวทางการทำ Data Analysis อย่างถูกต้องครบถ้วนนั่นเองค่ะ^^

ซึ่งเพื่อนๆ สามารถอ่านบทความที่เกี่ยวข้องกับได้ตาม Link นี้นะคะ =>> https://www.everydaymarketing.co/business-and-marketing-case-study/spotify-use-of-data-for-hijack-marketing/

Panaya Sudta

Hi, I am Nick,,,,Panaya Sudta (●'◡'●) Engineer during the daytime. Researcher at night. Reader in spare time. (❁´◡`❁) วิศวกร/นักวิจัย และเป็นน้องใหม่ของการตลาดวันละตอน ในการทำ Market research ค่ะ หวังเป็นอย่างยิ่งว่าจะได้แชร์มุมมองกันนะคะ

Leave a Reply

Your email address will not be published. Required fields are marked *