OpenAI核心研究员姚顺雨:别再迷信模型了,AI的下半场胜负手仅此一个

摘要:AI游戏进入下半场,真正的瓶颈已不是模型。OpenAI核心研究员姚顺雨揭示,创业公司唯一的机会在于创造超越ChatGPT的新交互方式。本文将为你剖析他关于任务定义、智能边界和未来世界格局的第一性原理,帮你找到在巨头阴影下的生存之道。

AI的游戏规则,已经变了。

如果你还在为某个模型跑分提升0.5%而激动,或者担忧算力储备不如巨头,那么你很可能还在用上半场的地图,打下半场的仗。真正的战场,早已悄然转移。

所有人都盯着模型本身时,OpenAI自己的核心研究员姚顺雨,在2025年4月用一篇名为《The Second Half》的博文,宣告了旧时代的终结。他告诉我们,那把能解决大多数问题的“通用武器”——大语言模型——已经诞生。接下来要思考的,不再是如何造枪,而是该朝哪个方向开枪。

这篇文章,将借由姚顺雨的第一视角,为你揭示AI下半场的残酷真相与唯一胜机。它关乎你我的未来身价,以及在被巨头阴影笼罩的牌桌上,如何找到那张属于自己的王牌。


对于所有身处牌局中的人来说,结论只有一个:放弃对模型能力的盲目崇拜,你的全部价值,在于创造一个超越现有范式的全新交互方式

想在AI的下半场活下来并赢得漂亮,你必须理解这三个洞察:

第一,真正的瓶颈已经从“模型能力”转向了“任务定义”。我们有了锤子,现在最缺的是值得被砸的钉子。
第二,创业公司最大的护城河,是设计出不同于ChatGPT的新交互。巨头因其超级应用而强大,也必将因此产生路径依赖。
第三,未来世界既不会被一家垄断,也不会百花齐放。它将是一个“既单极又多元”的复杂生态,智能的边界由不同的超级应用共同定义。

上半场的终结:当“武器”已经通用

我们必须承认一个事实:在语言这个赛道上,方法层面的问题已基本解决。

回想几年前,AI领域还是一个个孤立的部落。研究视觉的、研究语言的、研究强化学习的,各自为战。大家把问题越分越细,为每个怪兽都打造一把专属的武器。

姚顺雨自己也曾是这个部落体系的一员。他最早研究计算机视觉,但他很快意识到,语言才是实现通用智能(AGI)最核心的工具,因为语言是人类为了“泛化”而发明的工具,这一点比任何东西都更本质。

 

 

2018年,当95%的研究者都在追捧BERT模型时,他选择了当时仅有少数人关注的GPT路径。因为他发现,世界的本质是开放的,智能体需要的是自由生成新动作的能力,而不是在有限选项里做选择题——这正是BERT的局限。

这个看似微小的选择,却是一个关键的转折点。

从GPT-2到GPT-3.5,再到思维链(Chain of Thought)的出现,一把能够“推理”的通用武器诞生了。AI研究的主线程,正式从“造各种武器”转向“用一把武器解决所有问题”。

这就是AI的“下半场”。上半场,我们比的是谁的武器更锋利;下半场,我们比的是谁更懂得用这把武器,去定义和解决一个真正有价值的任务

唯一的生路:创造新的交互方式

很多创业者最大的焦虑是——我做的任何Agent,都可能被OpenAI的模型能力溢出所吞噬。

这是一个致命的误解。

姚顺雨一针见血地指出:创业公司最大的机会,恰恰在于能够设计不同的interface(交互方式)

ChatGPT的本质,是一种“拟人化”的交互。你像和助手聊天一样与它协作。这无疑是一个超级应用,但它也给OpenAI带来了巨大的路径依赖。所有资源和迭代,都会不自觉地围绕这个“助手”形态展开。

这就像2020年的谷歌,手握Transformer和无限资源,最自然的想法却是“如何用它提升搜索引擎”,而不是创造一个ChatGPT。

真正的机会,在于创造那些“不像人”的交互方式。

Cursor是一个绝佳的样本。它不是你的“编程助手”,而是你的“副驾驶”(Copilot)。它给你的代码提供实时建议和编辑,这种交互在人与人之间从未存在过。它的价值不在于模型本身,而在于它创造了一种全新的、与IDE环境深度融合的、更高效率的交互形态。

所以,别再问“我如何做一个更好的聊天机器人”,你应该问:

在编程、在科研、在设计、在交易的世界里,是否存在一种全新的交互方式,它不是ChatGPT的模仿品,却能借助模型的能力,成为那个领域的Super App?

这才是留给创业者的黄金赛道。大厂可以复制你的功能,但很难复制你围绕新交互方式构建的整个产品、环境和用户心智。

姚顺雨甚至认为,这个世界是一个“相互抄”的关系,而不是大厂对创业公司的单向碾压。你创造了新的交互,大厂会借鉴;大厂提升了模型能力,你也能借力。这是一种动态的平衡。

 

智能的边界:一个既单极又多元的世界

那么,最终的智能形态会是怎样?一个无所不能、统一所有交互的“最强Agent”吗?

姚顺雨的答案是:不会。

如果世界真的被一个单极系统垄断,那将是灰暗的。最终的智能边界,将由不同的交互方式和它们所催生的不同Super App共同定义。

这个世界会变得越来越单极——中心化的模型能力会越来越强,巨头会像黑洞一样吸纳资源和算力。

但它同时也会变得越来越多元——被模型赋能的个体和组织,有机会在各自的领域,通过创造新的交互方式,形成新的价值孤岛和生态系统。

就像人类社会一样。我们最崇拜两种人:一种是爱因斯坦式的“创新者”,他们拥有内在的激励和长期记忆,能在没有外部奖励的情况下探索未知;另一种是乔布斯式的“组织者”,他们能让多个智能体高效协作。

这两种能力,都指向了超越单一Agent的系统。

未来,可能会有一个Agent是你的朋友,它不需要那么理性,甚至会犯错;也可能会有一个由无数Agent组成的交易网络,信息在其中高速流转,达成人类无法想象的复杂协作。

这些,都是ChatGPT无法完全覆盖的广袤空间。

写在最后

我们正处在一个巨大的转折点。

技术的发展,让中心化加剧的同时,也给了边缘的普通人更多创造新事物的机会。关键在于,你是否意识到了游戏规则的改变。

与其在红海中拼凑一个平庸的Agent,不如从第一性原理出发,去思考那个真正能创造增量价值的场景,去设计那个独一无二的交互方式。

想清楚你的用户价值是什么,这是最重要的。技术永远是工具,而价值本身才是那座永恒的灯塔。

如果你对AI的下半场也有所思考,欢迎在留言区分享你的洞见,我们一起探讨。

首页    行业洞察    OpenAI核心研究员姚顺雨:别再迷信模型了,AI的下半场胜负手仅此一个