发布日期: 2025年11月04日
              
              
              北京时间11月4日,全球首个AI大模型实时投资比赛“Alpha Arena”圆满结束。这场由独立研究机构Nof1于10月18日发起的竞赛,汇集了来自中美两国的六个顶尖大模型。
包括中国的DeepSeek v3.1和Qwen3-Max,以及美国的GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5和Grok 4。
在长达17天的激烈角逐中,每个模型使用一万美元初始资金,在真实市场环境中进行完全自主的投资决策,没有任何人工干预。最终,来自中国的Qwen3-Max和DeepSeek v3.1表现惊艳,分别以超过20%和5%的收益率包揽冠亚军。

Alpha Arena竞赛的设立开创了人工智能在金融投资领域应用的先河。这场比赛不仅是技术的较量,更是对各大AI模型在复杂多变金融市场中实战能力的严峻考验。
参赛的六个模型代表了当今全球最先进的AI技术水平。
来自美国的选手包括OpenAI的GPT-5、Google的Gemini 2.5 Pro、Anthropic的Claude Sonnet 4.5以及马斯克旗下的Grok 4;中国代表队由DeepSeek v3.1和Qwen3-Max组成。
比赛初期,DeepSeek v3.1便展现出强大实力,一路领先引发国际关注。马斯克旗下的Grok 4通过激进的投资策略,一度将与DeepSeek v3.1的差距缩小到仅1美元,场面十分胶着。
然而,10月21日至22日成为整场比赛的转折点。这两天内,Grok 4和Claude Sonnet 4.5的收益大幅下滑,由盈转亏。10月22日当天,六个大模型的收益率更是一度全部告负,市场波动对所有AI模型都构成了严峻挑战。
在关键时刻,DeepSeek v3.1和此前表现不佳的Qwen3-Max展现了出色的学习与适应能力,自动改写了投资策略,在其他四个大模型持续亏损的情况下脱颖而出,净值曲线波动上涨。
Qwen3-Max更是趁机一度超过DeepSeek v3.1.预示了最终比赛结果的走向。

随着赛事推进,参赛模型逐渐分化为三大阵营,形成了清晰的对局态势。这场竞赛已超越了简单的技术比拼,演变为中美两国在AI金融投资领域的一次直接对话。
第一阵营由两家中国模型组成,Qwen3-Max与DeepSeek v3.1屡次互换第一位置,但始终牢牢占据领先地位。这两款中国模型展现出明显的协同优势,无论是在市场适应性还是策略调整能力方面,都表现出惊人的一致性。
第二阵营则由Claude Sonnet 4.5和Grok 4组成,它们在相近策略驱动下,维持在略有盈利但整体仍亏损的状态。尽管这两款美国模型试图通过各种策略扭转局势,但始终未能突破中国模型的领先地位。
最令人意外的是,GPT-5和Gemini 2.5 Pro这两大被寄予厚望的美国顶尖模型,竟然长期亏损垫底,尤其是GPT-5最终亏损超过60%,在全部六个参赛模型中表现最差。这一结果无疑给美国AI开发团队带来了巨大震动。
AI投资大赛最终结果显示,阿里千问Qwen3-Max以1.22万美元的结余资金,超过20%的收益率夺得冠军,DeepSeek v3.1则以1.05万美元的成绩获得亚军。
关键数据显示,这两个中国模型是比赛中唯二实现盈利的模型,而四大美国顶尖模型无一例外全部以亏损收场。
【EBC平台风险提示及免责条款】:本材料仅供一般参考使用,无意作为(也不应被视为)值得信赖的财务、投资或其他建议。