【财新网】4月17日,字节跳动旗下火山引擎面向B端发布豆包1.5深度思考模型,这是字节跳动首款推理模型,可在解决问题时“边想边搜”,根据目标规划搜索路径;同时具备视觉推理能力,可以综合理解图片中的各类信息。
推理模型是指模型在预训练之后的阶段采用强化学习、思维链的技术,进一步“训练”提高模型处理复杂逻辑推理任务的能力。
OpenAI于2024年9月率先推出o1模型让业界转向推理模型,而后DeepSeek于1月20日推出推理模型R1,凭借顶尖的能力引发了广泛讨论。此后,互联网厂商间AI基座模型的竞争加剧,腾讯、阿里先后推出T1、QwQ-32B推理模型,百度则在3月17日推出首个推理模型X1。