【财新网】
5月29日上午,DeepSeek上线DeepSeek-R1-0528,标志着DeepSeek R1模型迎来首次重要升级。该模型仍使用DeepSeek V3 模型作为基座,但整体表现已接近o3和Gemini-2.5-Pro等顶尖模型。DeepSeek同时还推出了基于新版R1模型训练的小模型Qwen3-8B ,DeepSeek称以此得到的模型能力比肩2350亿参数的Qwen3-235B。
【财新网】
5月29日上午,DeepSeek上线DeepSeek-R1-0528,标志着DeepSeek R1模型迎来首次重要升级。该模型仍使用DeepSeek V3 模型作为基座,但整体表现已接近o3和Gemini-2.5-Pro等顶尖模型。DeepSeek同时还推出了基于新版R1模型训练的小模型Qwen3-8B ,DeepSeek称以此得到的模型能力比肩2350亿参数的Qwen3-235B。
推荐进入财新数据库,可随时查阅公司股价走势、结构人员变化等投资信息。