【财新网】
小米首个推理大模型开源
4月30日,小米开源首个推理大模型“Xiaomi MiMo”,由预训练和后训练阶段中数据和算法等多层面的创新联合驱动提升推理能力,小米方面介绍,在数学推理(AIME 24-25)和 代码竞赛(LiveCodeBench v5)公开测评集上,MiMo 用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。
4月29日,腾讯宣布成立大语言模型部和多模态模型部,分别负责大语言模型和多模态模型的前沿技术研发,同时腾讯大模型团队原有的数据平台部将专注于大模型数据的建设,原有的机器学习平台部聚焦机器学习和大数据融合平台建设,这两个部门为AI模型的训练、推理提供底座。腾讯向财新称,此次调整有利于整合资源,优化研发流程,提升腾讯在AI领域的长期技术作战能力。