Subscribe to Our Newsletter

Success! Now Check Your Email

To complete Subscribe, click the confirmation link in your inbox. If it doesn’t arrive within 3 minutes, check your spam folder.

Ok, Thanks
ผลทดสอบชี้ AI ยังห่างไกลจาก AGI แม้อุตสาหกรรมโฆษณาเกินจริง

ผลทดสอบชี้ AI ยังห่างไกลจาก AGI แม้อุตสาหกรรมโฆษณาเกินจริง

Avareum Research profile image
by Avareum Research

การทดสอบมาตรฐานใหม่ในด้านปัญญาประดิษฐ์ (AI) ของ ARC-AGI-3 ได้เผยให้เห็นช่องว่างที่สำคัญระหว่างการอ้างอิงถึงปัญญาประดิษฐ์ทั่วไป (AGI) กับความเป็นจริง โดย AI ชั้นนำหลายรุ่นทำคะแนนไม่ถึง 1% ในขณะที่มนุษย์ทำได้เต็ม 100% การทดสอบนี้มีจุดประสงค์เพื่อตรวจสอบว่าระบบ AI มีความสามารถในการสำรวจ วางแผน และเรียนรู้จากประสบการณ์ในสภาพแวดล้อมที่ไม่คุ้นเคยหรือไม่ โดยที่ไม่ต้องพึ่งพาการจดจำรูปแบบที่ได้ฝึกฝนมาแล้ว จากการประกาศของ Jensen Huang ซีอีโอของ Nvidia ที่กล่าวว่าขณะนี้เราได้บรรลุ AGI แล้ว การทดสอบล่าสุดแสดงให้เห็นว่า AI ยังห่างไกลจาก AGI มาก

ในวันเดียวกัน ARC Prize Foundation ได้ออกผลทดสอบ ARC-AGI-3 โดยที่ Google’s Gemini 3.1 Pro ทำคะแนนได้ 0.37% OpenAI’s GPT-5.4 ได้ 0.26% Anthropic’s Claude Opus 4.6 ได้ 0.25% และ xAI’s Grok-4.20 ได้ 0% ในขณะที่มนุษย์สามารถแก้ไขได้ทุกสถานการณ์ การทดสอบนี้แตกต่างจากการสอบวิชาทั่วไป เพราะ ARC-AGI-3 ถูกสร้างขึ้นโดย François Chollet และ Mike Knoop ในการทดลอง AI เข้าสู่สถานการณ์เกมใหม่โดยไม่รู้กฎใดๆ โดยผู้ที่ผ่านการทดสอบจำเป็นต้องสร้างความรู้ใหม่โดยไม่อิงกับการฝึกฝนมาก่อน

ในส่วนของเกณฑ์การทดสอบ ARC-AGI-1 และ ARC-AGI-2 นั้นเป็นการทดสอบการรับรู้ภาพแบบคงที่และการคาดการณ์รูปแบบต่อไป ซึ่งการทดสอบรุ่นที่สามนี้จะทำให้ AI ไม่สามารถจดจำฐานข้อมูลได้ง่ายๆ เพราะมี 110 จาก 135 สภาพแวดล้อมที่ถูกเก็บไว้เป็นความลับ การทดสอบนี้ไม่ใช่การสอบผ่านหรือตก คะแนนถูกคำนวณจาก Relative Human Action Efficiency (RHAE) ซึ่งจะมีการปรับน้ำหนักคะแนนเมื่อ AI ดำเนินการล่าช้ากว่ามนุษย์

แม้จะมีการถกเถียงเกี่ยวกับวิธีการทดสอบ เช่น ที่ Duke ได้ทำการทดสอบพิเศษให้กับ Claude Opus 4.6 ซึ่งผลลัพธ์คือ 97.1% ในกรณี TR87 โดยที่ผลทดสอบทั้งหมด Claude Opus 4.6 ยังคงได้คะแนน 0.25% และเป็นตัวอย่างที่ชี้ให้เห็นถึงจุดอ่อนของการทดสอบ​ แต่ทางองค์กรก็ปฏิเสธการปรับเปลี่ยนรูปแบบทดสอบ โดยเชื่อว่าการรับรู้ได้เพียงพอแล้ว และปัญหาเกิดจากการวิเคราะห์และการสร้างความรู้ใหม่

ในเวลานี้ บริษัทต่างๆ ยังคงพยายามโปรโมทการพัฒนา AI สูงสุด ไม่ว่าจะเป็น Jensen Huang, Sam Altman จาก OpenAI หรือ Microsoft ที่พัฒนาห้องปฏิบัติการ ASI ถึงแม้จะเห็นการอ้างอิงถึง AGI ในหลากหลายรูปแบบ แต่ความจริงแล้ว AGI ยังไม่มีในขณะนี้ ด้วยทุนรางวัล $2 ล้านจาก ARC Prize 2026 ที่ถูกตั้งขึ้นมาเพื่อรองรับผู้เข้าร่วมการแข่งขัน และการพัฒนาทั้งหมดจะต้องเปิดเผยสู่สาธารณะ

Source: https://decrypt.co/362496/is-agi-here-not-even-close-ai-benchmark

#AvareumNews #AI #AGI #Google #OpenAI

This newsletter is produced with assistance from OpenAI's ChatGPT-4o. All analyses are reviewed and verified by our research team.

Avareum Research profile image
by Avareum Research

Success! Now Check Your Email

To complete Subscribe, click the confirmation link in your inbox. If it doesn’t arrive within 3 minutes, check your spam folder.

Ok, Thanks

Read More