【财新网】随着人工智能技术的发展,AI幻觉问题也日益受到关注。2025年两会期间,全国人大代表、国内人工智能企业科大讯飞的董事长刘庆峰建议,应预防大模型生成“幻觉数据”充斥互联网带来的危害,从技术研发和管理机制上构建可信的信息环境。
AI幻觉(AI Hallucinations)指的是大模型时常胡编乱造,而且有时候编得足以以假乱真,或者出现“AI 运算偏差”,产生与真实世界不一致的内容。
一项最近更新于2月11日的测评显示,DeepSeek R1的幻觉率为14.3%(平均总结长度77.1个词),相对较高,DeepSeek -V3的幻觉率则为3.9%(平均总结长度88.2个词)。测评的所有模型中,表现最佳的是Google Gemini -2.0- Flash -001,幻觉率只有0.7%(平均总结长度65.2个词)。同样是国产模型的智谱Zhipu AI GLM -4-9B- Chat 幻觉率为1.3%(平均总结长度58.1个词),GPT -4o的幻觉率则为1.5%(平均总结长度77.8个词)。