首页 > 新车资讯 > 新车资讯 > 微软重磅发布Phi-4推理模型,小型AI挑战大模型霸主

微软重磅发布Phi-4推理模型,小型AI挑战大模型霸主

发布时间:2025-05-01 22:45:41来源: 13663887898

5 月 1 日消息,微软昨日(4 月 30 日)发布 Phi-4-reasoning 系列推理模型,通过监督微调 Phi-4,并利用 o3-mini 生成的高质量“可教导”提示数据集训练,专为复杂推理任务设计。

IT之家援引博文介绍,微软本次共推出 Phi-4-reasoning、Phi-4-reasoning-plus 和 Phi-4-mini-reasoning 三款模型,官方称该系列模型不仅延续了小型模型的高效特性,还在推理能力上实现重大突破。

该系列模型通过推理时间扩展(inference-time scaling)技术,擅长处理需要多步骤分解和内部反思的复杂任务,尤其在数学推理和代理型应用中表现突出,具备媲美大型前沿模型的潜力。

Phi-4-reasoning 是一款拥有 140 亿参数的开源推理模型,通过监督微调(Supervised Fine-Tuning,SFT)Phi-4,结合 OpenAI o3-mini 的高质量推理演示数据,并充分利用额外计算资源,生成详细的推理链条。

Phi-4-reasoning-plus 增强版通过强化学习(Reinforcement Learning,RL)进一步提升性能,tokens 用量比标准版多 1.5 倍,支持更高精度。

两款模型在数学推理和博士级科学问题测试中,均超越 OpenAI o1-mini 和
DeepSeek-R1-Distill-Llama-70B
,甚至在 AIME 2025(美国数学奥林匹克资格赛)中击败 6710 亿参数的 DeepSeek-R1 满血模型。

Phi-4-mini-reasoning 专为计算资源有限的环境设计,是一款基于 Transformer 的紧凑型语言模型,优化用于数学推理。

新车资讯更多>>

Keychron推出75%配列键盘B31:3.5mm键程剪刀脚,出厂预润 真我Neo8发布:首销2399元起 全球首发165Hz三星苍穹屏 11小时10分霸榜!REDMI Turbo 5 Max把2.5K档续航卷成“友商噩梦”? 全新OriginOS 6新一轮公测招募开始报名,覆盖vivo S20等机型 小米汽车Apple Music现已支持杜比全景声播放 华为Pura 90系列再次被确认:20GB +鸿蒙OS 6.1,无3D人脸! Meta宣布Threads平台月活跃用户突破4亿,面向全球推出广告 阿里云智能集团资深副总裁李飞飞:内存价格预计还会上涨两到三倍 第二届CVPR 2026 CV4CHL Workshop征稿启动 AI大模型守护儿童未来 日系彩电时代“彻底落幕” 双3D缓存新王登基!AMD锐龙9 9950X3D2跑分曝光:单多核均超9950X3D 消息称华为Mate 80单品激活150万,逆袭成年底国产旗舰第一 2026开年旗舰:苹果狂卖1726万台,华为、小米、OV、荣耀谁在掉队 L3自动驾驶也来合川尝年味 开源版Cowork爆火,逼得Anthropic下放Cowork 月产80万公斤,纺织巨头宣布破产 深康佳:因工作安排原因,总裁曹士平请求辞职 Indigo 3000:一个瑞典跑车创业梦的始末 消息称OPPO拥抱国产影像传感器:中端线导入思特威,旗舰线豪威 突发!iPhone 18 Pro要砍灵动岛?苹果这步棋赌上了未来三年的口碑 2025中国手机出货量公布:华为4670万台排名第一,荣耀跌出前五 从不到1500元成本到估值数千万,深夜宣布更名的“死了么”还有“钱”途吗? 390亿美元Figure做不到的事,这家中国团队做到了 荣耀MagicOS 10更新全攻略:老机流畅度飙升50%,这2款真无缘? 荣耀亲选iotapk AI通话耳机发布,799元可独立通话 摩托罗拉首款“AI感知伴侣”硬件曝光 海南封关不是封岛!iPhone省2000+,购物、医疗、就业红利全解析 7.2英寸屏,主动散热风扇,华为要干游戏手机了? 从月销过万到盈利突破,智己2025年做对了什么?解读增长密码 丰田卡罗拉各代车型尺寸排名:其车身的不断增大也同样引人入胜