【财新网】
5月29日上午,DeepSeek上线DeepSeek-R1-0528,标志着DeepSeek R1模型迎来首次重要升级。该模型仍使用DeepSeek V3 模型作为基座,但整体表现已接近o3和Gemini-2.5-Pro等顶尖模型。DeepSeek同时还推出了基于新版R1模型训练的小模型Qwen3-8B ,DeepSeek称以此得到的模型能力比肩2350亿参数的Qwen3-235B。
【财新网】
5月29日上午,DeepSeek上线DeepSeek-R1-0528,标志着DeepSeek R1模型迎来首次重要升级。该模型仍使用DeepSeek V3 模型作为基座,但整体表现已接近o3和Gemini-2.5-Pro等顶尖模型。DeepSeek同时还推出了基于新版R1模型训练的小模型Qwen3-8B ,DeepSeek称以此得到的模型能力比肩2350亿参数的Qwen3-235B。
责任编辑:覃敏 | 版面编辑:李东昊
DeepSeek更新R1模型 称其整体能力接近OpenAI最强模型
2025年05月29日Anthropic发大模型 Claude 4 能持续工作数小时完成千个步骤
2025年05月23日财新网所刊载内容之知识产权为财新传媒及/或相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。
如有意愿转载,请发邮件至hello@caixin.com,获得书面确认及授权后,方可转载。
免费订阅财新网主编精选版电邮