财新传媒
公司 > 要闻 > 正文

DeepSeek更新R1模型 称其整体能力接近OpenAI最强模型

文|财新 刘沛林
2025年05月29日 22:07
新版本以DeepSeek V3模型作为基座,在后训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力
5月29日上午,DeepSeek在开源社区Hugging Face上线了一款名为DeepSeek-R1-0528的模型。图:视觉中国

  【财新网】时隔5个月,DeepSeek R1模型迎来首次重要升级。5月29日上午,DeepSeek在开源社区Hugging Face上线了一款名为DeepSeek-R1-0528的模型。同日晚间,DeepSeek公布了该模型更多的信息,并称用户通过官方网站、APP或小程序进入对话界面后,开启“深度思考”就可体验最新版本。API也已经更新。

  DeepSeek介绍称,该模型仍然使用去年12月发布的DeepSeek V3模型作为基座,但在后训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力,在数学、编程和通用逻辑等测评中取得领先,并在整体表现上已接近o3和Gemini-2.5-Pro等顶尖模型。

  推荐进入财新数据库,可随时查阅公司股价走势、结构人员变化等投资信息。

责任编辑:覃敏 | 版面编辑:鲍琦
推广

财新网主编精选版电邮 样例
财新网新闻版电邮全新升级!财新网主编精心编写,每个工作日定时投递,篇篇重磅,可信可引。
订阅