DeepSeek更新R1模型称其整体能力接近OpenAI最强模型

文｜财新刘沛林

2025年05月29日 22:07

新版本以DeepSeek V3模型作为基座，在后训练过程中投入了更多算力，显著提升了模型的思维深度与推理能力

: 5月29日上午，DeepSeek在开源社区Hugging Face上线了一款名为DeepSeek-R1-0528的模型。图：视觉中国

相关报道: 国家发展改革委主任郑栅洁主持召开座谈会听取民营企业意见建议; 【中国改革】从规模经济看DeepSeek对创新发展的启示; 医疗机构如何部署DeepSeek？近30家机构出台国内首部专家共识; DeepSeek效应几何量化基金何成中国AI大模型孵化器; 大模型时代来临，能直接用DeepSeek看病吗？

　　【财新网】时隔5个月，DeepSeek R1模型迎来首次重要升级。5月29日上午，DeepSeek在开源社区Hugging Face上线了一款名为DeepSeek-R1-0528的模型。同日晚间，DeepSeek公布了该模型更多的信息，并称用户通过官方网站、APP或小程序进入对话界面后，开启“深度思考”就可体验最新版本。API也已经更新。

　　DeepSeek介绍称，该模型仍然使用去年12月发布的DeepSeek V3模型作为基座，但在后训练过程中投入了更多算力，显著提升了模型的思维深度与推理能力，在数学、编程和通用逻辑等测评中取得领先，并在整体表现上已接近o3和Gemini-2.5-Pro等顶尖模型。

　　推荐进入财新数据库，可随时查阅公司股价走势、结构人员变化等投资信息。

　　财新机器人产业指数(RII)已发布，点击了解行业动态

责任编辑：覃敏 | 版面编辑：鲍琦

更多更快财经资讯请看财新一线

DeepSeek更新R1模型称其整体能力接近OpenAI最强模型

推荐阅读

图片推荐

视听推荐

编辑推荐

财新名家

视频

博客

最新文章

English - Caixin Global

In Depth: The Unfinished Transformation of China’s LGFVs

In Depth: From Skies to Shackles, HNA Founder Chen Feng Sentenced to 12 Years in Prison

U.S. Details Steep Port Fees on China-Linked Vessels Starting Oct. 14

The Shady Deals Behind a Veteran Banker’s Suspended Death Sentence

Dongfeng Spins Off EV Brand Voyah for Independent Hong Kong Listing

DeepSeek更新R1模型 称其整体能力接近OpenAI最强模型

推荐阅读

图片推荐

视听推荐

编辑推荐

最新文章

English - Caixin Global

DeepSeek更新R1模型称其整体能力接近OpenAI最强模型