Update Gemini จาก Google มีอะไรว้าว มีอะไรขาด? แนะนำการใช้งาน และเทรนด์

Update Gemini จาก Google มีอะไรว้าว มีอะไรขาด? แนะนำการใช้งาน และเทรนด์

สวัสดีค่ะทุกท่าน เมื่อไม่กี่ชั่วโมงที่ผ่านมา Google ได้ปล่อย Gemini Ultra ออกมา ซึ่งตัวนี้จะหมายถึง Gemini Advanced ที่จะมาแทนที่ Bard ที่พวกเราใช้กันก่อนหน้านี้ และนับว่าเป็น AI ตัวใหม่และโมเดลที่ดีที่สุดที่ Google ปล่อยออกมาแล้วน่าจะมีศักยภาพเพียงพอในการแข่งขันกับคู่แข่งเจ้าสำคัญอย่าง ChatGPT ที่ใช้ gpt4 model

และนั่นคือคำถามที่น่าสนใจค่ะว่า,, จากศักยภาพและ Features ต่างๆ ที่เพิ่มเข้ามานั้นจะทำให้ LLM AI จากค่าย Google สามารถเอาชนะโมเดลจากค่าย OpenAI ได้จริงๆ หรือไม่ ทั้งในแง่ความสามารถของตัวโมเดลเอง และในแง่ของการใช้งานจริงของ User ซึ่งนั่นจะเป็นสิ่งที่เราจะมาหาคำตอบไปพร้อมๆ กันในบทความนี้ค่ะ ✪ ω ✪

  • 1. มา Update กันว่ามีอะไร Update ใหม่บ้าง
  • 2. มาลองทดสอบการใช้งานกันค่ะ
  • 3. ข้อจำกัดต่างๆ (ที่เจอตอนนี้)
  • 4. ข้อสรุป และแนวโน้มที่คาดว่าจะเป็นไปในอนาคต (ซึ่ง User อย่างเราควรทราบ)

เรื่องน่าสนใจอันดับแรกสำหรับนิกนี้ก็คือเรื่องของ “ชื่อ” ค่ะ ซึ่งน่าจะสร้างความสับสนให้ User อย่างเราๆ ไม่น้อยเลย ในการเปลี่ยนชื่อจาก Google’s Bard ที่เราคุ้นเคย เป็น Gemini Advanced (ซึ่งไม่เกี่ยวกับ Pro, Ultra หรือ Nano นะคะ) โดยตอนนี้จะไม่มี Bard ที่เราเห็นกันมาก่อนหน้านี้อีกแล้วนะคะ ซึ่ง AI model ที่อยู่เบื้องหลังคือ Ultra 1.0 ซึ่งเปิดให้ใช้งานแล้วกว่า 40 ภาษาในมากกว่า 230 ประเทศทั่วโลก

สรุปนะคะ => ไม่มี Bard แล้ว แต่เปลี่ยนชื่อเป็น Gemini Advanced ซึ่งโมเดลเป็น Ultra 1.0

เราสามารถใช้สิ่งนี้ได้โดยการ Subscribe AI Premium plan ของ Google ซึ่งว้าวมากๆ ที่ในตอนนี้ทาง Google ใจดีให้พวกเราลองใช้ฟรี 2 เดือน หลังจากนั้นจะยกเลิก หรือ subscribe ต่อก็ได้ โดยมีค่าใช้จ่ายอยู่ที่เดือนละ 750 บาท =>> ถูกกว่า ChatGPT Plus ( •̀ .̫ •́ )✧

ก็จะเข้ามาเจอกับหน้าแนะนำตามภาพด้านล่างค่ะ ซึ่งจะเห็นว่ามีการ Integrate ทั้งความสามารถของ Google map ในการให้คำปรึกษาเรื่องเส้นทางการเดินทางในลักษณะของทริปที่เราต้องการ หรือช่วยเราสร้างแพลนสำหรับเสาร์-อาทิตย์ ตลอดจนหา Flights และกิจกรรมในการท่องเที่ยว เป็นต้น

แต่สิ่งที่นิกจะแนะนำให้ทุกท่านลองคือ กดไปที่มุมซ้ายของคำว่า “Gemini” แล้วเลือก Upgrade ไปที่ตัว Advanced ค่ะ หลังจากนั้นก็ให้เราลอง “Start trial” อย่างไม่ต้องกังวล เพราะอย่างที่กล่าวไปค่ะว่า Google ใจดีให้เราใช้ฟรี 2 เดือน และหากเราชอบและต้องการ Subscribe ต่อ ความเท่ของตัว Advanced ก็คือเราจะได้ storage เพิ่มเป็น 2 TB ตลอดจน Features อื่นๆ ของ Google One Premium ไปด้วย (ส่วน Gemini บน gmail, docs และอื่นๆ ต้องรอไปก่อนนะคะ)

และแล้วก็มาถึงช่วงของการ Testing กันค่ะ โดยสัมผัสแรกที่พบเลยคือ ความเป็นมิตรต่อผู้ใช้ หรือ User Friendly ซึ่งในส่วนนี้พบว่า Gemini Advanced ทำได้ค่อนข้างดีเลยทีเดียว จากการที่เปรียบเทียบกับตัว ChatGPT พบว่า ถ้าเป็น GPT4 น่าจะต้องใช้ความเข้าใจในหลักการของ Prompt Engineer และอาจต้องมีประสบการณ์ในการใช้งานมาระยะหนึ่งเพื่อให้สามารถดึงศักยภาพของ ChatGPT ออกมาได้อย่างเต็มที่

เรามาลองเริ่มต้นจากคำสั่ง หรือว่า Prompt ง่ายๆ กัน เช่น ให้หากเราต้องการให้สรุปบทความหรือข้อความต่างๆ ใน 1 ประโยค โดยที่ให้หลีกเลี่ยงศัพท์วิชาการดัง Prompt ต่อไปนี้:

Your task is to summarize an abstract into one sentence.
Avoid technical jargon and explain it in the simplest of words.
Abstract: [ใส่บทความหรือข้อความที่เราต้องการที่จะสรุป]

credit: https://www.promptingguide.ai/models/gemini

ซึ่งจากผลลัพธ์ที่ได้ออกมาต้องบอกว่าทำได้ดีเลยทีเดียว นอกจากนี้สิ่งที่นิกค่อนข้างว้าวเลยก็คือ เรื่องของความเร็วในการ Response หรือการ Generate คำตอบออกมาค่ะ ที่ค่อนข้างไวมากๆ สำหรับ Results ที่เราได้รับค่ะ นอกจากนี้ Style ในการเขียนผลลัพธ์ก็มีความแตกต่างจาก ChatGPT เล็กน้อย ซึ่งจากความเห็นส่วนตัว นิกคิดว่าตัว ChatGPT จะมีให้ความรู้สึกอ่านแล้วเป็น AI มากกว่านิดหน่อย (แค่นิดหน่อยเท่านั้นนะคะ)

และจากความที่เป็น Google ทำให้เราสามารถทำ “Double-check response” ได้จากการกดไปที่สัญลักษณ์ตัว “G” ที่อยู่ด้านล่างของ Results ซึ่งหมายถึงการหาข้อมูลเพิ่มเติมจาก Google

ซึ่งหากเป็นลักษณะการใช้งานในเชิงหาคำตอบ สิ่งที่ได้ออกมาจะเป็นการ Highlight ที่มาของพาร์ทแต่ละพาร์ทใน Results ตามแหล่งที่มีของข้อความนั้นๆ ซึ่งจากสิ่งนี้เองที่เป็นประโยชน์มากๆ ให้กับผู้ใช้งานในการสืบค้นแหล่งที่มาของข้อมูลได้ง่ายๆ และเป็นการ recheck ว่าคำตอบที่เราได้มานั้นมีการ Hallucinations หรือ “หลอน” มาหรือไม่ (อธิบายเพิ่มเติมนะคะว่า อาการ AI Hallucination จากความเป็น LLMs ไม่ได้ลดลงนะคะ,, แต่แค่เราจะสามารถเชคความถูกต้องของข้อมูลได้เท่านั้นค่ะ)

นอกจากนี้ความเท่อีกอย่างก็คือการที่เราสามารถ Modify response หรือแก้ไขรูปแบบของคำตอบให้เป็นไปอย่างที่เราต้องการได้ง่ายๆ ผ่านการเลือกปรับปรุงตาม Icon ด้านล่างของ Results โดยที่เราไม่จำเป็นต้องทำการ Prompting เพื่อให้ได้สิ่งที่เราต้องการแบบ ChatGPT

ซึ่งหากเราต้องการให้คำตอบสั้นลง, หรือยาวขึ้น ก็เพียงแค่เลือก “Shorter” หรือ “Longer” หรือหากต้องการให้ง่ายขึ้น, ทางการมากขึ้น หรือ Professional มากขึ้น ก็สามารถเลือกปรับแต่งได้ง่ายๆ เช่นเดียวกัน^^

นอกจากนี้แล้วเรายังสามารถให้ระบบอ่านคำตอบให้เราได้ง่ายๆ โดยการกดไปที่รูป “ลำโพง” หรือ Listening ซึ่ง Feature นี้นิกชอบใช้ในกรณีที่นิกขับรถอยู่แล้วใช้งาน Gemini ไปด้วย ซึ่งสะดวกและการอ่านค่อนข้างเป็นธรรมชาติด้วยค่ะ^^

สิ่งหนึ่งที่ค่าย Google ยัง Provide ให้เราไม่ได้ (ในตอนนี้) ก็คือเรื่องของการ Upload PDFs ไฟล์ขึ้นไป เพื่อให้โมเดลสรุปหรือวิเคราะห์ข้อมูล หรือสำหรับสาย Developer ก็ยังไม่มี Service ของ Code Interpreter (แต่น่าจะถูกปล่อยออกมาในเร็วๆ นี้)

และในส่วนของ Image model จะไม่ได้มีการแอด DALLE เหมือนค่าย OpenAI แต่จะใช้เป็น Imagen 2 Model ซึ่ง Gemini ก็ยังสามารถ Create ภาพให้เราจาก Text หรือ Prompt ได้เหมือนกันค่ะ (ป.ล. ส่วนของการสร้างภาพอาจต้องพิมพ์คำสั่งเป็นภาษาอังกฤษนะคะ,, นิกลองพิมพ์เป็นภาษาไทยแล้วไม่สามารถสร้างภาพให้ได้)

นอกจากนี้สิ่งที่แตกต่างจาก GPT คือการที่เราจะยังไม่สามารถ Setting ในส่วนลักษณะของ Bot เช่น ชื่อ, Description, Instruction หรืออื่นๆ ได้สำหรับ Gemini

และอีกสิ่งหนึ่งที่ขาดไปก็คือในเรื่องของความยาวของข้อความที่สามารถใช้งานได้ หรือ Token limits ซึ่งทาง Google ยังไม่ได้มีข้อมูล Provide ให้ในส่วนนี้ ซึ่งจะต่างจากทาง OpenAI ที่มี service “OpenAI tokenizer” ตามลิงค์: https://platform.openai.com/tokenizer ที่เราสามารถเชคจำนวนโทเคนได้เลย เพียงแค่วางตัว prompts ของเราลงไป^^

แน่นอนค่ะว่าการเข้ามาของ Gemini จะเป็นสิ่งที่สามารถเข้ามาเป็นตัวแปรให้การเปลี่ยนแปลงในการแข่งขันของ LLMs Model มีความดุเดือดมากยิ่งขึ้น ซึ่งโดยความเห็นส่วนตัวแล้ว นิกคิดว่าโมเดลนี้จาก Google นับได้ว่าเป็นคู่แข่งที่มีศักยภาพของ ChatGPT ถึงแม้ว่าจะขาด Features บางอย่างไป แต่ก็นับว่ามีข้อดีที่เป็นจุดเด่นที่สามารถทำให้แข่งขันได้ โดยเฉพาะอย่างยิ่งในเรื่องการใช้งานที่ค่อนข้างง่ายสำหรับ User

และที่สำคัญตอนนี้ฟรีให้ทดลองใช้ 2 เดือนค่ะ เพราะฉะนั้นจะแปลกอะไรที่เราจะเข้าไปลองใช้กัน ซึ่งเพื่อนๆ สามารถเข้าไปลองและสามารถใช้ความสามารถในส่วนของ Google Flights, Hotels, Maps, Workspace หรือ Youtube ที่ถูก integrate เข้ามาเลย โดยที่ไม่จำเป็นต้องแอดเป็น extension เหมือน ChatGPT ซึ่งจากการที่สิ่งเหล่านี้เป็น ecosystem เดียวกัน ทำให้เราสามารถได้รับประสบการณ์การใช้งานที่ค่อนข้างลื่นไหล ในทุกๆ แพลตฟอร์มที่มีการส่งผ่านข้อมูลถึงกันค่ะ

ดังนั้นหากพิจารณาจากแนวโน้มต่างๆ ที่เกิดขึ้น สำหรับ ChatGPT จากค่าย OpenAI น่าจะวางตัวเองให้อยู่ในบทบาทของ LLM ที่เป็น Autonomous agent ทั้งในส่วนของ GPTs เอง หรือสิ่งต่างๆ ที่อยู่ใน GPT store (เพื่อนๆ สามารถอ่านบทความเพิ่มเติมเรื่อง Autonomous agent ได้จากลิงค์นี้ค่ะ: https://arxiv.org/pdf/2308.11432.pdf)

ในขณะที่ Gemini Advanced พยายามวางตัวให้เหมือนเป็นผู้ช่วย เป็นติวเตอร์ เพราะทั้งช่วยแพลนเที่ยวให้เรา, ช่วยเราเรียนบทเรียนที่เราอยากรู้ โดยความสามารถของผู้ช่วยของเราจะยิ่งเพิ่มสูงขึ้นเรื่อยๆ เข้าใจความต้องการของเรามากขึ้นเรื่อยๆ ตามความถี่และปริมาณที่เราใช้งาน โดยเฉพาะอย่างยิ่งเมื่ออาศัยความสามารถของ ecosystems ของ Google แล้ว ยิ่งเป็นการเพิ่มความสามารถให้ Gemini สามารถเป็นผู้ช่วยส่วนตัวของเรา ในการที่เราจะสามารถใช้งานเพื่อให้ได้ผลลัพธ์ที่เราต้องการได้ค่ะ^^

ถ้าเพื่อนๆ ลองใช้งาน Gemini Advanced แล้วได้ผลลัพธ์อย่างไร สามารถร่วมแชร์และพูดคุยแบ่งปันกันได้เลยนะคะ โดยเฉพาะอย่างยิ่งในส่วนของการใช้งานด้านการตลาด ,,,, Enjoy khaa (^∀^●)ノシ

Panaya Sudta

Hi, I am Nick,,,,Panaya Sudta (●'◡'●) Engineer during the daytime. Researcher at night. Reader in spare time. (❁´◡`❁) วิศวกร/นักวิจัย และเป็นน้องใหม่ของการตลาดวันละตอน ในการทำ Market research ค่ะ หวังเป็นอย่างยิ่งว่าจะได้แชร์มุมมองกันนะคะ

Leave a Reply

Your email address will not be published. Required fields are marked *