GPT-5算不算AGI?AGI到底来没来?如来!面对各说各话的局面,我们迫切需要一个图灵测试式的权威标准来定义AGI。独立第三方非营利性AI研究机构,同时也是主流LLM评测标准HLE(Humanity's Last Exam,人类的最后考试)的提出者,AI安全中心(Center for AI Safety)的Dan Hendrycks和Yoshua Bengio等一众顶尖AI学者,于昨天发布了论文《A Definition of AGI》,给出了他们对AGI的定义,试图让AI研究机构和公众厘清通往AGI的真正方向。
在Yoshua Bengio和Dan Hendrycks等一众顶尖AI学者提出的AGI新检验标准中,GPT-5在长期记忆存储这一项中斩获0分!

GPT-5总分也仅有58分,目前仍处于挂科状态,未通过这场AGI测试。

长期以来,AGI(通用人工智能)这个词就像个不断移动的靶子,每当AI攻克一项过去被认为需要人类智慧的任务,我们就会把AGI的标准推得更远。
这导致关于「我们离AGI还有多远」的讨论经常各说各话、难有定论。
为了解决这个问题,Yoshua Bengio和Dan Hendrycks等研究者于昨日公开论文《A Definition of AGI》,在论文中提出了一个清晰且可量化的AGI定义。
