ผลทดสอบชี้ AI ยังห่างไกลจาก AGI แม้อุตสาหกรรมโฆษณาเกินจริง
การทดสอบมาตรฐานใหม่ในด้านปัญญาประดิษฐ์ (AI) ของ ARC-AGI-3 ได้เผยให้เห็นช่องว่างที่สำคัญระหว่างการอ้างอิงถึงปัญญาประดิษฐ์ทั่วไป (AGI) กับความเป็นจริง โดย AI ชั้นนำหลายรุ่นทำคะแนนไม่ถึง 1% ในขณะที่มนุษย์ทำได้เต็ม 100% การทดสอบนี้มีจุดประสงค์เพื่อตรวจสอบว่าระบบ AI มีความสามารถในการสำรวจ วางแผน และเรียนรู้จากประสบการณ์ในสภาพแวดล้อมที่ไม่คุ้นเคยหรือไม่ โดยที่ไม่ต้องพึ่งพาการจดจำรูปแบบที่ได้ฝึกฝนมาแล้ว จากการประกาศของ Jensen Huang ซีอีโอของ Nvidia ที่กล่าวว่าขณะนี้เราได้บรรลุ AGI แล้ว การทดสอบล่าสุดแสดงให้เห็นว่า AI ยังห่างไกลจาก AGI มาก
ในวันเดียวกัน ARC Prize Foundation ได้ออกผลทดสอบ ARC-AGI-3 โดยที่ Google’s Gemini 3.1 Pro ทำคะแนนได้ 0.37% OpenAI’s GPT-5.4 ได้ 0.26% Anthropic’s Claude Opus 4.6 ได้ 0.25% และ xAI’s Grok-4.20 ได้ 0% ในขณะที่มนุษย์สามารถแก้ไขได้ทุกสถานการณ์ การทดสอบนี้แตกต่างจากการสอบวิชาทั่วไป เพราะ ARC-AGI-3 ถูกสร้างขึ้นโดย François Chollet และ Mike Knoop ในการทดลอง AI เข้าสู่สถานการณ์เกมใหม่โดยไม่รู้กฎใดๆ โดยผู้ที่ผ่านการทดสอบจำเป็นต้องสร้างความรู้ใหม่โดยไม่อิงกับการฝึกฝนมาก่อน
ในส่วนของเกณฑ์การทดสอบ ARC-AGI-1 และ ARC-AGI-2 นั้นเป็นการทดสอบการรับรู้ภาพแบบคงที่และการคาดการณ์รูปแบบต่อไป ซึ่งการทดสอบรุ่นที่สามนี้จะทำให้ AI ไม่สามารถจดจำฐานข้อมูลได้ง่ายๆ เพราะมี 110 จาก 135 สภาพแวดล้อมที่ถูกเก็บไว้เป็นความลับ การทดสอบนี้ไม่ใช่การสอบผ่านหรือตก คะแนนถูกคำนวณจาก Relative Human Action Efficiency (RHAE) ซึ่งจะมีการปรับน้ำหนักคะแนนเมื่อ AI ดำเนินการล่าช้ากว่ามนุษย์
แม้จะมีการถกเถียงเกี่ยวกับวิธีการทดสอบ เช่น ที่ Duke ได้ทำการทดสอบพิเศษให้กับ Claude Opus 4.6 ซึ่งผลลัพธ์คือ 97.1% ในกรณี TR87 โดยที่ผลทดสอบทั้งหมด Claude Opus 4.6 ยังคงได้คะแนน 0.25% และเป็นตัวอย่างที่ชี้ให้เห็นถึงจุดอ่อนของการทดสอบ แต่ทางองค์กรก็ปฏิเสธการปรับเปลี่ยนรูปแบบทดสอบ โดยเชื่อว่าการรับรู้ได้เพียงพอแล้ว และปัญหาเกิดจากการวิเคราะห์และการสร้างความรู้ใหม่
ในเวลานี้ บริษัทต่างๆ ยังคงพยายามโปรโมทการพัฒนา AI สูงสุด ไม่ว่าจะเป็น Jensen Huang, Sam Altman จาก OpenAI หรือ Microsoft ที่พัฒนาห้องปฏิบัติการ ASI ถึงแม้จะเห็นการอ้างอิงถึง AGI ในหลากหลายรูปแบบ แต่ความจริงแล้ว AGI ยังไม่มีในขณะนี้ ด้วยทุนรางวัล $2 ล้านจาก ARC Prize 2026 ที่ถูกตั้งขึ้นมาเพื่อรองรับผู้เข้าร่วมการแข่งขัน และการพัฒนาทั้งหมดจะต้องเปิดเผยสู่สาธารณะ
Source: https://decrypt.co/362496/is-agi-here-not-even-close-ai-benchmark
#AvareumNews #AI #AGI #Google #OpenAI
This newsletter is produced with assistance from OpenAI's ChatGPT-4o. All analyses are reviewed and verified by our research team.