
Image generated with OpenAI
ความคิดเห็น: เหตุผลว่าทำไมตัวแทน AI จึงเป็นอนาคตของ AI ในชีวิตประจำวัน
ดูเหมือนว่าปี 2025 จะเป็นปีของ Agentic AI แน่นอน บริษัทเทคโนโลยีชั้นนำหลายๆ บริษัท เช่น OpenAI, Microsoft, Anthropic และอื่นๆ ได้เปิดตัวโมเดล AI ที่สมบูรณ์ที่สุดของพวกเขา ที่สามารถทำงานซับซ้อนที่ยังทำไม่ได้ในปีที่ผ่านมา แต่ AI agents คืออะไรอย่างจริง และเทคโนโลยีนี้มีส่วนที่เป็นจริงมากน้อยแค่ไหน เมื่อเทียบกับความฮายป์?
การติดตามแนวโน้ม AI ในปีที่ผ่านมาอาจทำให้รู้สึกเหนื่อย พวกเราได้มาจาก AI พื้นฐานไปสู่ AI ที่สร้างสรรค์ แล้วก็ไปสู่ AI ที่มีการตัดสินใจ และตอนนี้ AI agents กำลังครองบทพูด ในช่วงเดือนที่ผ่านมา บริษัทเทคโนโลยีหลายแห่งได้แนะนำ AI agents ใหม่ๆ และได้เน้นว่าการทำงานที่เชื่อมต่อกันเข้ามากขึ้นจะเป็นทางเลือกที่น่าสนใจมากขึ้น
ในเดือนมกราคม, OpenAI ได้เปิดตัว AI agent ครั้งแรก ที่ชื่อว่า Operator ซึ่งสามารถทำงานแบบอัตโนมัติได้ เช่น การเรียกดูเว็บ การจองร้านอาหาร หรือการทำการจองบัตรคอนเสิร์ตให้คุณ ตามความชอบและเกณฑ์ที่คุณกำหนด
สองเดือนหลังจากนั้น บริษัทสตาร์ทอัพ AI ของจีน ชื่อว่า Zhipu ได้เปิดตัว AutoGLM Rumination AI agent ที่สามารถทำงานอย่างอิสระและวางแผนการท่องเที่ยวให้กับผู้ใช้ และเพียงไม่กี่วันที่ผ่านมา Microsoft ได้นำเสนอ “Computer Use” สำหรับ Copilot Studio เพื่อเพิ่มความสามารถในการทำงานอย่างอิสระให้กับ AI agents รวมถึงความสามารถในการควบคุมหน้าจอ desktop ของผู้ใช้
แต่แนวโน้มนี้ไม่ได้เกี่ยวกับเพียงแค่บริษัทที่เปิดตัวสินค้าใหม่ที่เจ๋งๆเท่านั้น – มันเกี่ยวกับฟิลด์ที่ซับซ้อนและพัฒนาอย่างต่อเนื่องที่ผสมผสานรูปแบบต่างๆ ของ AI กับการสื่อสารของมนุษย์ ผู้คลั่งไคล้เทคโนโลยีและผู้เชี่ยวชาญทั่วไป มองเห็นความเชื่อมั่นที่แข็งแกร่งใน Agentic AI.
“แนวโน้มหนึ่งที่ฉันก็ตื่นเต้นอยู่คือ กระบวนการทำงานของ AI agents,” บอกโดยผู้เชี่ยวชาญ AI และผู้ร่วมก่อตั้ง Coursera และ DeepLearning คือ Andrew Ng, ใน การประชุม Snowflake’s BUILD 2024 เมื่อเดือนพฤศจิกายน. “ถ้าคุณถามว่า, เทคโนโลยี AI อันไหนที่สำคัญที่สุดที่ควรจะให้ความสนใจ? ฉันจะตอบว่าคือ Agentic AI.”
เอาล่ะ ตัวแทน AI คืออะไรเหรอ? พวกมันทำงานได้ดีเท่าที่ผู้เชี่ยวชาญอ้างอยู่หรือไม่? นี่คือภาพรวมสั้น ๆ ของลักษณะสำคัญที่สุดของเทคโนโลยีที่กำลังเ emerge นี้และการพัฒนาล่าสุด
ตัวแทน AI คืออะไร?
เช่นเดียวกับที่บริษัทอย่าง OpenAI และ Microsoft ได้แสดงให้เห็น ตัวแทน AI คือเทคโนโลยีที่สามารถทำงานที่ซับซ้อนโดยอัตโนมัติผสมผสานแอปพลิเคชันและซอฟต์แวร์ต่าง ๆ
พื้นฐานแล้ว, พวกเขาคือ “AI chatbots แบบดั้งเดิม” แต่มีความสามารถที่สูงขึ้น, สามารถทำงานที่เกินกว่าที่เราได้รับคุ้นชินในสองปีที่ผ่านมา ซึ่งรวมถึงการวางแผน, การท่องเว็บ, การจดจำความสนใจของคุณ, และแม้กระทั่งการทำซื้อของรายวันของคุณโดยไม่ต้องมีการแนะนำทีละขั้นตอน เนื่องจากพวกเขาสามารถคิดสิ่งต่างๆ ได้ด้วยตัวเอง
Google Cloud นิยาม AI agents ว่า “ระบบซอฟต์แวร์ที่ใช้ AI เพื่อแสวงหาเป้าหมายและทำงานเสร็จสิ้นในนามของผู้ใช้”
สิ่งที่ทำให้โมเดล AI นี้สมบูรณ์แบบจริง ๆ คือความสามารถในการวิเคราะห์ที่สูงขั้น ซึ่งทำให้สามารถประมวลผลข้อมูลหลากหลายประเภท – เสียง, ข้อความ, วิดีโอ, รหัส, และภาพ – ได้พร้อมกัน พวกเขาสามารถเข้าใจสถานการณ์ที่ซับซ้อนอย่างที่มนุษย์จะทำ, ดำเนินการ, และทำงานร่วมกับซอฟต์แวร์และแพลตฟอร์ม
ในปัจจุบัน บริษัทเทคโนโลยีหลายแห่งกำลังผลักดันโมเดล AI ของตนไปสู่ระดับถัดไป
เมื่อไม่กี่วันที่ผ่านมา OpenAI ได้ประกาศว่าโมเดล AI ของเขา o3 และ o4-mini สามารถ “คิด” ด้วยภาพ และจัดการกับภาพเหล่านั้น – ตัดหรือเปลี่ยนแปลงภาพเช่นนั้นเอง ในระหว่างนี้ ฟีเจอร์ใหม่ “Computer Use” ของ Microsoft ช่วยให้ตัวแทน AI สามารถรู้จำอินเตอร์เฟซผู้ใช้แบบกราฟิกได้.
“ถ้าคนสามารถใช้แอปพลิเคชันได้ ตัวแทนก็สามารถทำได้เช่นกัน,” คุณ Charles Lamanna, รองประธานบริษัท, ธุรกิจ & คิดำนานการที่ Microsoft กล่าวไว้ในการประกาศครั้งนี้.
ระดับถัดไป: เทคโนโลยี AI ที่มีศักยภาพ
ในขณะที่บริษัทเทคโนโลยีหลายๆ แห่งกำลังพัฒนา AI chatbots ที่ฉลาดสุดๆ อยู่ เทคโนโลยี agentic AI กลับไปขั้นตอนที่เหนือกว่า โดยเน้นในการสร้างระบบที่หลายๆ ตัวของตัวแทน AI สามารถทำงานร่วมกันและทำหน้าที่ต่างๆ ซึ่งจะนำมาซึ่งผลลัพธ์ที่แม่นยำและครบถ้วนมากยิ่งขึ้น
ในการบรรยายเรื่อง “พลังของตัวแทน AI” ในงาน Tech Talk ล่าสุดที่ฉันเข้าร่วม ซึ่งจัดโดย eDreams ผู้เชี่ยวชาญด้าน AI คุณ Patricia Gutierrez Faxas ได้อธิบายว่าระบบเหล่านี้สามารถปรับเปลี่ยนโครงสร้างในหลายๆ รูปแบบ ระบบตัวแทนหลายตัวนั้นสามารถแบ่งงานที่ซับซ้อนเป็นงานที่ง่ายกว่า และมอบหมายให้กับตัวแทนที่มีความเชี่ยวชาญ พร้อมทั้งสร้างเครือข่ายที่แตกต่างกัน
ตัวแทน AI สามารถรับบทบาทเป็น “ผู้ดูแล” โดยมอบงานที่เล็กลงให้กับตัวแทนที่มีความเชี่ยวชาญในด้านอื่น ๆ หรือตัวแทนหลาย ๆ ตัวสามารถทำงานพร้อมกันบนงานที่แตกต่างกันและประสานงานเพื่อส่งมอบผลลัพธ์สุดท้าย บางประโยชน์ของระบบเหล่านี้รวมถึงความแม่นยำที่ดีขึ้น ความเป็นส่วนตัวที่มากขึ้น และข้อผิดพลาดที่ลดลง
Andrew Ng เห็นด้วยกับวิธีการนี้ ในการพูดคุยของเขาที่ BUILD 2024 เขาได้เน้นความสำคัญของกระบวนการทำงานของ Agentic AI สำหรับการประมวลผลงานที่ซับซ้อนด้วยผลลัพธ์ที่ดีขึ้นมาก การกระโดดขึ้นของประสิทธิภาพจากโมเดลเช่น GPT-3.5 ไปยัง GPT-4—และผลลัพธ์ที่แข็งแกร่งขึ้นในการทดสอบการเขียนโค้ด—ส่วนใหญ่เกิดจากกระบวนการทำงานแบบ agentic และการคิดคำนวณแบบ agentic
AI จะมีผลต่อชีวิตของเราอย่างไร?
บริษัทเทคโนโลยีต่างๆ กำลังเลือกวิธีการที่แตกต่างกันในการทำ Agentic AI. OpenAI ได้มุ่งเน้นไปที่ไอเดียสำหรับผู้ใช้ทั่วไป ในการเปิดตัว Operator, ทีมงานได้อธิบายในวิดีโอว่าผู้ใช้สามารถคิดถึงเมนูที่ต้องการทำ, แล้วถาม ChatGPT เพื่อหาสูตรที่ดีที่สุด, และแม้แต่สามารถสั่งซื้อส่วนผสมที่จำเป็นจากซูเปอร์มาร์เก็ตออนไลน์ได้เลย.
โมเดล AI สามารถถามคำถามเพิ่มเติมและหยุดรอก่อนการดำเนินการที่สำคัญ อย่างการสมบูรณ์การซื้อด้วยบัตรเครดิตของผู้ใช้ ผู้ใช้สามารถตั้งค่าวงเงินหรือต้องการให้ผู้ช่วยขอยืนยันก่อนซื้ออะไร
ความเป็นไปได้ที่คนธรรมดาสามารถใช้ตัวแทน AI ดูเหมือนจะไม่มีที่สิ้นสุด แต่การใช้งานที่ได้รับความนิยมมากที่สุดตอนนี้ ได้แก่การทำหน้าที่เป็นตัวแทนการท่องเที่ยว ผู้ช็อปปิ้งส่วนตัว และผู้ช่วยด้านการดำเนินงานทั่วไป-เมื่อทั้งหมดแล้วใครจะไม่ต้องการเทคโนโลยีที่ตั้งค่าได้ที่ส่งอีเมล จำวันเกิดที่สำคัญ และดูแลภาษี
ไมโครซอฟท์ได้เลือกทางการเป็นผู้นำในด้านธุรกิจใหญ่ บริษัทได้ทำการสาธิตว่าองค์กรทางการตลาดสามารถใช้ AI agents ในการรวบรวมข้อมูลตลาดและสร้างการวิเคราะห์ที่ขับเคลื่อนด้วยข้อมูล หรือว่าองค์กรขนาดใหญ่สามารถใช้พวกมันในการประมวลผลใบแจ้งหนี้ภายในระบบของพวกเขา
อย่างไรก็ตาม แม้ว่าทุกแบบอย่างการใช้งานเหล่านี้จะฟังดูเหมือนว่ามีการปฏิวัติ แต่ผู้เชี่ยวชาญยังเห็นด้วยกันว่ายังมีการเดินทางที่ยาวไกลข้างหน้า หลายคนยังไม่สามารถใช้ AI agents เพื่อปรับปรุงชีวิตประจำวันของพวกเขา ดังนั้นคุณลักษณะหลายอย่าง เช่น Operator ยังมีเพียงสำหรับผู้ใช้ Pro เท่านั้น ซึ่งต้องสมัครสมาชิกที่มีราคา $200 ต่อเดือน
ดังนั้น, AI แบบ Agentic สามารถตรงกับความคาดหวังได้หรือไม่?
หัวข้อข่าวสื่อมวลชนมากมายกำลังสัญญาว่าจะมีการปฏิวัติ AI ใหม่ที่นำโดย Agentic AI แน่นอนว่าในอุตสาหกรรมนั้นมีความสนใจที่มากเกินไป และความเป็นจริงอาจจะไม่นานเกินจะตามมา รายงานล่าสุด ที่ IBM ได้แบ่งปัน ได้เปิดเผยว่านักพัฒนามากมายกำลังสำรวจและพัฒนาเทคโนโลยีนี้อย่างคล่องแคล่ว
“IBM และ Morning Consult ได้ทำการสำรวจความคิดเห็นจากนักพัฒนา 1,000 คนที่กำลังสร้างแอปพลิเคชัน AI สำหรับองค์กร และข้อมูลที่ได้มาเป็น 99% ของพวกเขาที่กล่าวว่าพวกเขากำลังสำรวจหรือพัฒนาเอเจนท์ AI” ดร.มาริยัม อัชูรี่ ผู้อำนวยการฝ่ายจัดการผลิตภัณฑ์ที่ IBM watsonx.ai ได้อธิบายไว้ “ดังนั้น คำตอบก็คือ ปี 2025 นี้จะเป็นปีของเอเจนท์.”
อย่างไรก็ตาม ผู้เชี่ยวชาญระบุว่ามีการแปลความหมายของตัวแทน AI อย่างหลากหลาย และวิธีการที่ตัวแทน AI ควรทำงานอย่างไร ดังนั้น ความก้าวหน้าและประสิทธิภาพของตัวแทน AI ในปัจจุบันมักขึ้นอยู่กับมุมมองและมาตรฐานของบุคคลที่ประเมินเทคโนโลยีนี้
สิ่งที่แน่นอนคือหลายๆ ผู้เชี่ยวชาญและผู้ตัดสินใจไว้วางใจในเทคโนโลยีนี้อย่างลึกซึ้งและลงทุนมากในการพัฒนา การศึกษาเมื่อเร็วๆ นี้เผยว่า 84% ของผู้นำด้าน IT ไว้วางใจตัวแทน AI เท่ากับมนุษย์ และ OpenAI คาดการณ์ว่าจะมีรายได้ประมาณ 125 พันล้านดอลลาร์สหรัฐฯ ในปี 2029.
ถึงแม้ว่าเทคโนโลยี AI แบบ Agentic ยังไม่ได้พัฒนาบริบูรณ์และการนำไปใช้ยังไม่แพร่หลายเท่ากับ chatbots โดยส่วนใหญ่เนื่องจากค่าใช้จ่ายที่สูง—เราสามารถเห็นได้ชัดเจนว่าความกระตือรือร้นและความรู้สึกเชื่อมั่นที่ยิ่งใหญ่ที่มีต่อแนวโน้มนี้เพียงพอที่จะขับเคลื่อนการเปลี่ยนแปลงที่สำคัญในหลายเดือนที่จะมา.