GPT革命｜字节跳动发布豆包视觉理解模型定价比行业低85%

文｜财新关聪

2024年12月18日 13:27

字节跳动将在2025年春季推出具备更长视频生成能力的豆包视频生成模型1.5版

相关报道: 【财新周刊】财新周刊｜AI大模型开闭源之战; 【财新周刊】财新周刊｜特别报道：中国AI大模型开闸; 豆包是什么？AI应用概念为何爆发？｜解释; GPT革命｜字节跳动发布“豆包”大模型花1元可处理200万汉字; GPT革命｜字节跳动发布豆包视频生成大模型强调商业落地; 特稿｜AI大模型场景未通先卷价格中国云厂商在焦虑什么？; GPT革命｜谷歌与OpenAI“打擂台” 发布新一代大模型Gemini 2.0

　　【财新网】字节跳动正加速视觉、语音等多模态模型的商业化。12月18日上午，字节跳动旗下火山引擎在上海发布豆包视觉理解模型，通过火山引擎开放给企业客户，并再次打出了低于行业的定价。

　　视觉理解模型即“看图说话”，可以识别图像中的物体类别、形状等要素，理解物体之间的关系，给出空间和场景的整体判断，能用在图片问答、医疗健康、教育、科研、电商等场景。

　　在现场演示中，豆包视觉理解模型识别出了杂志插图中的外太空星云、一段“贪吃蛇”游戏代码并给出修正意见、桌面上的物件和使用方法、体检报告中的单项指标解读、联想图画想表达的谚语、推荐穿搭以及根据实物发送抖音商城里的商品链接等。目前豆包视觉理解模型已经接入豆包App和PC端产品。

　　推荐进入财新数据库，可随时查阅公司股价走势、结构人员变化等投资信息。

　　财新机器人产业指数(RII)已发布，点击了解行业动态

责任编辑：覃敏 | 版面编辑：吴秋晗

更多更快财经资讯请看财新一线

GPT革命｜字节跳动发布豆包视觉理解模型 定价比行业低85%