【财新网】全球大模型仍在竞速跑。当地时间7月9日晚,马斯克旗下AI公司xAI发布最新一代大模型Grok 4和Grok 4 Heavy,其中Grok 4为单智能体版,消费者可花30美元/月订阅体验;Grok 4 Heavy为多智能体版,订阅费用高达300美元/月。
马斯克以“人类最后的测试”(Humanity’s Last Exam)为标准,发现在不使用工具的情况下,Grok 4的分值为25.4%,高于谷歌最先进的Gemini 2.5 Pro(21.6%),也高于OpenAI的o3大模型(21%)。如果让大模型调用工具,Grok 4的分值达34.6%,Grok 4 Heavy的分值达44.4%。“人类最后的测试”难度很高,包括了2500个极其困难的学术问题,涉及一百多个学科。