首页 > 新车资讯 > 新车资讯 > Bengio推AGI「高考」,GPT-5单项0分

Bengio推AGI「高考」,GPT-5单项0分

发布时间:2025-10-18 10:18:18来源: 18811119908

GPT-5算不算AGI?AGI到底来没来?如来!面对各说各话的局面,我们迫切需要一个图灵测试式的权威标准来定义AGI。独立第三方非营利性AI研究机构,同时也是主流LLM评测标准HLE(Humanity's Last Exam,人类的最后考试)的提出者,AI安全中心(Center for AI Safety)的Dan Hendrycks和Yoshua Bengio等一众顶尖AI学者,于昨天发布了论文《A Definition of AGI》,给出了他们对AGI的定义,试图让AI研究机构和公众厘清通往AGI的真正方向。

在Yoshua Bengio和Dan Hendrycks等一众顶尖AI学者提出的AGI新检验标准中,GPT-5在长期记忆存储这一项中斩获0分!

GPT-5总分也仅有58分,目前仍处于挂科状态,未通过这场AGI测试。

长期以来,AGI(通用人工智能)这个词就像个不断移动的靶子,每当AI攻克一项过去被认为需要人类智慧的任务,我们就会把AGI的标准推得更远。

这导致关于「我们离AGI还有多远」的讨论经常各说各话、难有定论。

为了解决这个问题,Yoshua Bengio和Dan Hendrycks等研究者于昨日公开论文《A Definition of AGI》,在论文中提出了一个清晰且可量化的AGI定义。

新车资讯更多>>

岚图梦想家蝉联10月高端MPV销量冠军 累计交付破15万 OpenAI酝酿进军健康领域 拟打造个人健康助手 1799元起,vivo Y500 Pro发布 2亿主摄、7000mAh半固态蓝海电池 华为Mate80或要晒芯片硬参数,且镜头模组也出炉了! OPPO Reno14夺冠,荣耀400强过vivo S30 iPhone 17 Pro Max跑赢整体,iQOO 15跑赢国产 荣耀400系列全球发货量突破600万台,荣耀500如何“更懂用户”? 消息称苹果 iPhone Air 第二代目前正常测试中 大主播痛失“最低价”,头部直播间今年双11比什么? 2025年京东11·11:超级供应链驱动全链路增长 别克至境世家内饰曝光 三星 Galaxy S26 Ultra 手机前摄开孔直径被曝扩大至 4 毫米 “大幅削减产量”,苹果被曝推迟下一代iPhone Air 曝小米汽车全年累计交付破32万台 下周或完成年度目标 保持较高增长!10月我国新能源汽车销量首次超总销量的50% 汽车之家第三季营收17.78亿:净利4亿 总分红10亿 广汽埃安UT super携电池租用方案入场,换电模式能否搅动10万级纯电市场? AI 如何评价100款热门SUV?新能源屠榜 新势力细分场景掀翻行业认知 宝马7系都换代了,奥迪A8还在\"挤牙膏\",下一代奥迪A8渲染图曝光 鲲鹏超级增程首发车型,小鹏X9超级增程正式预售,35万元起 埃安UT super上市,整车售价8.99万元,电池租用价4.99万元 浙江出海大卖冲刺A+H上市,9个月利润超6亿! 全系标配磁流变悬架!深蓝L06定档11月18日上市 460万美元训练!月之暗面万亿参数模型登顶开源榜首,国产模型的又一个DeepSeek时刻 星闪E2.0来了,华为展示音频野心,要颠覆TWS耳机市场? 鸭子大军下地成“开荒冠军” 女孩为减肥参加海岛求生35天减28斤 从屏幕到广场!最近“企鹅舞”火了 汉堡王中国被卖了!蜜雪冰城、泡泡玛特股东接手 “大湾鸡”火爆出圈!全运会吉祥物设计背后,藏着“性格玄机”?