财新传媒
财新传媒
1111111
财新通行证
T中

腾讯正式推出自研推理模型混元T1 小模型或将开源

文|财新 关聪
发布于 2025年03月22日 19:36 更新于 2025年03月26日 20:06
在混元T1后训练阶段,96.7%的算力投入到了强化学习训练,重点围绕纯推理能力的提升以及对齐人类偏好的优化
news 原图 3月21日夜间,腾讯正式推出自研强推理模型“混元T1”正式版。

  【财新网】3月21日夜间,腾讯正式推出自研强推理模型“混元T1”正式版。该模型早期版本此前曾在AI聊天机器人元宝APP上小范围测试,2月中旬曾和DeepSeek R1一起在元宝APP上提供模型服务。此次正式发布,腾讯称混元T1通过大规模强化学习,并结合数学、逻辑推理、科学和代码等理科难题的专项优化,进一步提升了推理能力。

  混元T1是腾讯混元发布的第一款推理模型。推理模型是指模型在预训练之后的阶段采用强化学习、思维链的技术,进一步“训练”提高模型处理复杂逻辑推理任务的能力。混元团队介绍,在模型后训练阶段,96.7%的算力投入到了强化学习训练,重点围绕纯推理能力的提升以及对齐人类偏好的优化。

责任编辑:屈运栩 | 版面编辑:刘潇

财新网所刊载内容之知识产权为财新传媒及/或相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。

如有意愿转载,请发邮件至hello@caixin.com,获得书面确认及授权后,方可转载。

推荐阅读
财新移动
说说你的看法...
分享
取消
发送
注册
 分享成功

订阅财新网主编精选版电邮>>