【财新网】时隔5个月,DeepSeek R1模型迎来首次重要升级。5月29日上午,DeepSeek在开源社区Hugging Face上线了一款名为DeepSeek-R1-0528的模型。同日晚间,DeepSeek公布了该模型更多的信息,并称用户通过官方网站、APP或小程序进入对话界面后,开启“深度思考”就可体验最新版本。API也已经更新。
DeepSeek介绍称,该模型仍然使用去年12月发布的DeepSeek V3模型作为基座,但在后训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力,在数学、编程和通用逻辑等测评中取得领先,并在整体表现上已接近o3和Gemini-2.5-Pro等顶尖模型。