刚刚,姚顺雨再谈 AI 下半场 | 附对话全文
发布时间:2026-06-05来源:APPSO
时隔一年后,姚顺雨再次公开讨论 AI 下半场这个话题。他的身份,从 OpenAI 研究员,变成了腾讯首席 AI 科学家。一年多前那篇刷屏的《欢迎来到 AI 下半场》, 他提到上半场拼谁能造出更强的模型;到了下半场,重心从「解决问题」挪到「定义问题」,评估比训练更重要,干活的人得换上产品经理的脑子。一年过去,这些预测正在变成现实,甚至比他预言的还快。就在这场对话前后,Anthropic 发布博客称它代码库里超过 80% 的代码已经由 Claude 写成,下半场真的开始加速了,这场和腾讯汤道生和姚顺雨的对谈,把下半场更本质的问题到了桌面上:当大模型方法论趋于成熟,真正的壁垒到底是什么?姚顺雨之所以加入腾讯,比起模型和算力,更吸引他的是「好问题」和「数据」上,他说今天 AI 像一把万能的锤子,能砸任何地方,真正稀缺的是那颗值得砸的钉子,而腾讯手里钉子够多。他直言中国大家有个不好的倾向,比较卷榜单,可实用性的价值大于榜单的价值。汤道生给出的答案是强调「扎根场景」与「组织对齐」,也坦白回应了外界对腾讯「没及时抓住 agent」的质疑。腾讯在 AI 下半场最核心的战略逻辑,并非追求最会刷榜的模型,需要最懂产品、最会落地、最能把模型和产品拧成一股绳的组织。token 效率、agent 的形态、研发组织怎么变扁平、模型和产品到底谁该管哪一段,这些今天真正卡住每一家公司的问题,都在这场对话里直白地被讨论。主持人:有请腾讯首席 AI 科学家,腾讯混元大语言模型及 AI Infra 负责人 姚顺雨先生。姚顺雨:大家好。我平时都是在海淀区,很少来朝阳区,很高兴。汤道生:今天我们两个对话,可能是一个比较新的形态,如果有什么出乎意料的,我想也是给大家一个惊喜。顺雨,你加入腾讯前,我记得我当时问过你一些问题 ,为什么下半场会选择来腾讯?而且你认为 AI 下半场最重要的是什么?姚顺雨 :首先解释一下什么叫做下半场,我最近感觉这个词有点被滥用,这个概念是我去年的一个博客提出来的,什么意思?其实我觉得在去年之前 AI 已经发展几十年,但是更加重要的是怎么去解决问题,去寻找好的方法,最近我觉得很明显就是说,方法论已经变得非常成熟,但寻找问题变得更加困难。举个例子,比如说过去我们发明 AIphaGo 这样的方法去下围棋,但是这个方法只用来适合下围棋或者下各种棋类。你会为了翻译做一个特别的模型,但是它只能做翻译,不能做其他事情。但是有了预训练和后训练之后我们发现,我们像有一个万能锤子,它可以砸任何钉子,它是一个通用方法论,可以解决各种各样的问题,反而更困难的是怎么寻找好的问题去解决。其实我觉得加入腾讯很重要一点,就是说这里有很多好问题、有很多产品,我觉得这一点在接下来变得越来越重要。一方面,好的产品能够解决第一个问题:我们做预训练和后训练之后到底要把它应用在什么地方产生价值;第二个是环境是非常重要的,如果没有好的环境,那 Agent 没有办法做各种各样的事情,比如说如果没有一个点外卖的 tool 的话,就没有办法点外卖,很多事情做不到,我觉得最重要的是 context,无论是企业还是个人,就像我上一次在 AGI-Next 说的一样,我觉得越来越重要的事情是 context。因为模型越来越擅长把一个非常复杂的输入变成输出,很多时候你的竞争壁垒就在于你有没有最原始的输入,你知不知道这个人他到底在干什么,你知不知道这个企业各种各样的信息,这一点我觉得腾讯有非常强的优势。但其实我觉得这只是第二大的原因,最重要的原因是文化,我记得我第一次跟你聊天,包括和其他总办老板聊天的时候,我第一印象大家都非常诚实,哪里做的好哪里做的不好,非常直白不会掩盖,我觉得这种坦诚是我第一印象。第二个就是说腾讯总体是一个基于 trust,而不是基于 metric 去运转的公司,我觉得这一点对于做 AI 是非常重要的,包括我觉得我们的文化有非常 low ego,有非常 solid 的这一面。我觉得这些文化对于长期做一个 AI 的组织是非常重要的,包括我们对长期主义的坚持,所以 AI 下半场最重要是什么?我个人觉得就是,我们应该在中国建立一个长期的基于 AGI 的组织,今天的 AI 主要有三部分:
首先是 foundation 的部分,我们怎么样把预训练和后训练最基础的东西做得非常 solid。第二部分是产品,我们怎么样把这样的技术,真的为人和社会产生价值。第三个是 frontier,我们怎么样探索新的研究范式,探索新的机会。我觉得最重要的是我们构建一个非常均衡的三角形一样的组织。第二就是需要正确的做事的方式,这些和我刚才说的文化也是吻合的。对于产品来说,有好的产品的 sense,有这种做产品的人是至关重要的。第三个,在中国我们今天所做的前沿探索不够多,所以我希望能把 frontier exploration 的精神能更多地注入到我们组织中。汤道生:你提到的聊的过程中感受到的真诚或者务实的氛围,也是经常我跟客户交流得到的反馈,我觉得我们的做事方式,做产品的理念,其实也是比较实事求是的,毕竟 AI 赛道是长跑,我觉得有时候认知也很重要,我们做的好的和不好的也得认,但关键是一个多维度的竞赛,我们看到现在模型有很多进步,我们做产品其实也是有越来越多的形态,不同的场景有不同的需求,我觉得未来还是非常可期的。你刚刚提到模型跟产品,产品可以说提供一个环境,里面要给模型提供 context 上下文,我想问一个问题,我们平时开会提的有一个词比较多是 Co-Design,怎么把产品关模型能够比较紧密底结合起来,尤其今天有这么多丰富的产品,从我们合作非常紧密的像元宝这样的一个聊天机器人,包括 AI 搜索,企业里面也有部署智能客服、智能营销,另外最近非常火的类龙虾像 CodeBuddy、Workbuddy 这样的产品,其实对于模型依赖很深,你怎么思考 Co-Design 这个方式?首先 CoDesign 的前提就是说模型本身要做的很 solid,有很多 foundational 的 work 要做好。首先我觉得预训练是一个相对就是产品 agnostic 的事情,它做的非常 solid 可以提供非常强的 foundation,而且预训练它最大的特点就是它是一个可泛化学习过程,它的进步可以带给各种各样下游任务持续的价值提升。后训练我觉得最重要一点是要设立好正确的 Eval,中国大家有个不好的倾向是大家喜欢刷榜,但是我觉得更重要的是如何实事求是的基于产品,基于真正的应用,构造更加真实的 Eval。第二要意识到可能「实用性」价值是大于刷榜价值,这一点我们做大量工作,跟各种各样产品进行了深度 Co-Design,Co-Design 很关键一点就是要产生相互信任,这一点我们做了大量工作,取得互信,怎么把产品数据用好,怎么把回流,怎么把 Eval 做好,有很多细节,我就不赘述。第三点我想说,LLM 时代和过去的 AI 最本质的区别就是泛化性,在 LLM 之前比如说做翻译产品,只要把翻译数据做的特别好就行了。你做一个围棋的程序,你只需要把围棋的数据准备特别好就行。但是今天即使你想只做一个 Coding Agent,你会发现其实需要的不仅是 Coding Agent 的数据,你需要非常好的聊天能力,非常强的搜索能力,非常强的指令遵循能力,非常强的推理能力,它其实是非常复合的 data 的 taxonomy,我觉得需要对这个事情有一个 taste。这个事情的推论就是说有很多产品的体系化地方,会有比较大的优势,比如说我们和元宝的 Co-Design 使我们模型产生很强的聊天和搜索能力,这样的能力又可以被迁移到 ima 和 Workbuddy 其他的产品,所以这些产品能够提供不同的数据,但是这些数据之间又可以相互泛化,它形成一个像网络一样的体系,我觉得这一点的价值越来越重要。汤道生:对,外部的榜也属于 Eval 的一种,所以我们内部做 Eval 跟外部的这种榜有什么区别?姚顺雨:首先 benchmark 还是有它的价值的,不是完全没有价值,只是说这些榜非常容易 overfitting。基于真实世界的数据会对模型的研发有帮助:首先就是你能发现模型很多底线问题,实际上我们先发一个 Preview 模型最主要的目的之一是希望能够获得真实世界反馈,能修复各种各样榜单中没有发现的问题,这个在会在正式版上面有很大的改进。第二点,你对真实的 Prompt distribution 会有一个更深的了解。我举个例子,比如说 benchmark 上面的这些题目可能它都是非常精确的,有非常长的 concrete description,它可能一般来说是一个单纯的问题,但是我们知道在现实场景中可能大家问的问题都是比较模糊的,可能就一两句话,它会不停追问,这些场景可以启发我们怎么去更好做这样的训练。第三点,我觉得甚至我们可以在这些产品上面获得一些灵感去推进现在还没有的榜单或者是没有领域的推进,比如说我们最近做了很多 Context learning 的工作,包括元宝的反馈也给我们很大的启发和帮助。所以我觉得产品和模型的互相成就是越来越重要的一个 AI 的话题。汤道生:我记得我们早期做元宝的时候还碰到多轮遵循的问题,好像在使用产品,大家这种迭代 Prompt 的方式跟 benchmark 还有差异,真正在产品里面大家使用所需要的能力确实好像跟 benchmark 还有蛮大的差异的。姚顺雨:其实我记得我第一次跟您聊的时候,你跟我讲了很多你过去的经历,从 QQ 空间、QQ 秀的时代,一直到我小学时候最喜欢的产品。到 QQ 音乐,到云到现在的元宝,其实跟你聊天很有意思,因为你做过各种各样的产品,to C 也有,to B 也有,远古时代的也有,最近 AI 时代的产品也有。我比较好奇,你觉得你做产品的第一性原理是什么,你觉得哪些经验和价值是不变的?哪些东西是变的?汤道生:我觉得其实最终做产品还是本着用户到底有什么需求,我到底怎么去解决他的痛点,怎么去给用户或者客户创造价值。在不同的时代,甚至不同的行业,你做一个产品还是需要能够给用户带来价值,他才会买单,才会使用。所以我倒觉得从 PC 互联网时代我们做空间、移动的时代做各种各样的产品、内容的产品,到产业互联网做云,其实我们也要花好多的时间、精力去听客户的声音,尝试去帮助他们去解决他的问题。底层的逻辑其实没有这么大的变化。但确实我觉得在 PC 互联网、移动互联网时代做产品跟今天在 AI 时代做产品还是有蛮多不一样的地方。首先从范式的角度来看,在 AI 时代以前我们做产品很多时候想的是通过功能来满足用户的需求,你作为一个产品提供方、服务提供方,你想清楚我提供怎么样的一个能力,让用户可能通过某些菜单去选,好像是一些「预制菜」,你只能在里面去点一样。但在 AI 时代做产品,它的那种开放式的服务形态就会带来很不一样的要求跟挑战,用简单的交互方式可能是自然语言,可能是语音,其实作为产品方你也不知道用户会问什么。所以要充分利用模型能力去理解用户的需求,然后通过比如说今天大模型的这种逻辑推理,能去调用工具的能力,产品去给模型提供各种各样可以用的工具,来应对这种开放式的需求,这个是我觉得跟我们过去做产品很不一样的地方。甚至也包括你刚刚提到的 Eval,以前我们做产品有很清晰很具体的产品的细节功能的描述,怎么去做设计、做研发、做测试,我觉得那个瀑布式的流程也比较清晰。但是做 AI 产品,我发现最大的变化是我们整个流程可能都要重新设计,尤其今年大部分的代码都由 AI 生成,我们的工程师可能会花更多的时间去做设计,架构的设计,把写代码的工作都交给 AI 了,然后定期去指导一下、修正一下。然后测试也要左移,更前置去想清楚针对我们各种案例 Eval、环境,我们对于开放式答案的要求,甚至 alignment 怎么对齐,我们用户所需要的那种风格,我感觉今天时代做产品其实要求的能力更全面。汤道生:更难了。我问你一下混元 3,大家都在说 Hy3 preview 是你腾讯的首秀,具体混元 3 做什么改变,你能给大家介绍一下吗?姚顺雨:其实我觉得没有什么秘密,今天做大模型从某种程度来说比较 Trivial 的事情,我们应该把 Infrastructure 做好,我们应该把数据做好,算法的部分反而是比较简单的。其实我觉得主要几个点吧。第一,我们把 Infrastructure 重建了,无论是预训练还是强化学习。第二是我们把数据和 Eval 做了很大的改变,如何去定义更真实的问题,如何丰富数据的 taxonomy,如何去提高数据的质量,这是一个永无止境的追求。第三,我觉得很重要的很多决策其实包括怎么去招人,怎么去设立模型的节奏,怎么去每天有很多的 Decision 要考虑很多 Trade off,我觉得可能没有一个很清晰的公式,我觉得是一个很 Taste driven 的事情。所以我其实挺好奇问你一个问题的,因为您刚刚跟我讨论 Co-Design 这个概念,我很好奇您对 Co-Design 这件事情是怎么想的,你觉得哪些事情是应该模型做的,哪些是产品应该做的?汤道生:我觉得 Co-Design 在不同阶段,过去这两年其实是一直在变化的,我觉得这个变化某种程度来讲是随着模型能力的升级而变化,当然整个行业、市场、用户的需求他在变化的过程中也会带来我们两边模型跟产品需要更好去满足。给我一个比较深的感受是怎么去对齐,因为在我们一起去做产品,去做对齐会的时候,我们有很多不同的决策,产品可能要针对某个方向去解决一些问题,模型到底怎么做去满足这个需求,但是你要回到模型需要数据,数据应该怎么标注,到什么颗粒度,到底什么是好的标注,什么是不好的标注,因为有一些地方要奖励,有一些地方要惩罚。然后还有 Eval,还有评测,因为如果产品认为好的产品体验,评测是不认同的话,大家其实做出来的产品就会不一致了。所以 Co-Design 给我的感觉更多是在项目组里面不同的角色参与到产品的设计,定了一些产品的目标方向,怎么让多个角色能够对于一些开放式问题有比较好的对齐,如果没有做到这样一个对齐的话,你会发现产品的行为会不可预测。甚至有时候会有一些随机性,因为模型训练的过程可能也被混淆了。所以这是我这两年跟做产品跟模型团队做 Co-Design 的一个比较深的感受。您觉得呢?姚顺雨:其实我是觉得,就像我刚刚说的,首先最难的一点是要建立 Trust,毕竟我觉得同理心很重要,因为说到底做模型的目标和做产品的目标有很多 align 的部分,也有很多不 align 的部分。就是模型人希望我能力越强越好,但是产品的人觉得用户需求越满足越好。所以天然有很多不 align 的部分,我觉得很重要的一点是要有换位思考的能力。其实就是你刚刚问我元宝我们是怎么一步一步 Co-Design 的,其实一个很重要的细节是,我们当时是派了后训练最强的骨干力量,去帮助元宝把后训练做好。当时我们自己的预训练还没有准备好,但是我们知道维护元宝这样的产品以及它的 DAU 会对我们接下来做模型也非常非常重要,而且对于创新的合作非常重要。所以当时其实很多算法同学不理解,我需要去很努力解释,但是现在看起来这些努力都是 Trade off,我觉得这样一个动作让产品意识到模型的同学是真的在为产品着想,我觉得这个其实对于我们之后的合作,包括 Hy3 preview 在元宝上成功上线起到了非常重要的作用。当然有很多技术的部分可以探讨,但是最难的部分反而是怎么样建立信任,怎么样换位思考。汤道生:对,非常认同。我换一个话题,你是 ReAct 架构的提出者,博士研究也是围绕着语言智能体展开的,你几年前的一些观点到今天兑现了吗?比如有哪些?姚顺雨:那天我挺感慨的,我重新读了自己的博士论文,感觉又回到一个很远古时代,我的博士论文的 title 叫做 language Agent from next token prediction to digital automation,是 2019 年。姚顺雨:那个时候 Literally 就是我们的 GPT2,那个时候它只能做 Next token prediction,而且它产生一段话不太连续,或者有很多毛刺,所以当时人们很难想象到它有一天成为一个改变世界的力量,当时我觉得可能大家做的研究,稍微有想像力做一些研究,比如说中国首都是,如果做 Next token prediction 它会回答北京,somehow 它是一个有 Knowledge 的事情,能做到这一点大家当时非常开心,觉得这个技术很有意思。当时我的想象力比较狂野,我觉得 GPT 是一个非常优美的东西,吐下一个 Token 是一个非常极简且非常通用的事情,我觉得它有一天潜力不仅仅是在于吐出下一个 Token,而在于把这个世界上所有的事情全部 automate,我当时想的还不够大,我想的是 digital automation,但是现在看起来也有可能是 digital and physical automation。我觉得其实我博士期间主要做两部分,第一部分就是如何建立一个 Agent 方法论,如何把一个 Next Token prediction 的机器变成一个 Agent,变成一个自动化的机器,最重要的工作可能是你说的 react。我记得 2022 年 7 月份的时候某一天晚上,当我第一次把 Pump two 的 API 和当时手写的一个 Wikipedia API 连在一起,它第一次可以基于这个网页回答问题,并且多轮交互的时候,我当时感觉就像微弱电灯灯突然亮的感觉一样,我感觉据我所知,人类第一次把 LLM 和互联网连在一起并且做多轮交互,我当时的感觉是,这个感觉可能在 5 年或者 10 年会改变这个事情,但是可能比我想象中还要更快。我记得当时我们第一次提出 SWE-bench 的时候,我觉得 OK,如果这个事情能做到,那很显然它会带来巨大价值,当时可能是几百亿、上千亿,但现在可能是数万亿,数是万亿,可能我想的还是太小了。另一部分我做的工作就是怎么定义 Digital automation 的任务,比如说 WebShop 是第一个基于互联网的 Web Agent task,包括 InterCode 和 SWE-bench 是最早的 Coding Agent 这样的任务。现在看起来 Agent 技术最重要两个部分确实是外部 Agent 和 Coding Agent。那天我在群里跟大家聊天,我看我博士论文结尾,就是我在 2024 年写我的 future work,第一个是 train models for Agent,第二个是 shift and robust deployment,第三个是 scientific discovery,第四个是怎么样去 help human,我很感慨,我说我现在很幸运确实在做当时列的 future direction。汤道生:太厉害了,都一一看到整个行业这些方向在推进。姚顺雨:可能想的还是不够大,我觉得已经觉得自己想的够大了,但是可能还是不够大,我觉得。汤道生:技术的发展往往超乎我们的预期。智能体今天大家都说需要消耗很多的 Token,Token 的调用,这对于混元做下一代模型研发,你觉得什么是你的侧重,有哪些地方比较重要?姚顺雨:毫无疑问今天 Agent 或者 Coding Agent 有点像预训练一样,是不得不做的事情,是最基础能力。我个人觉得 Coding Agent 非常本质有很多原因。还有一个重要原因就是说它是一个优点像图灵完备的事情,当你有能力去控制自己的 file system,当你有一个 container 的时候,其实你是一个 complete 这样一个 system,今天我觉得 Agent 毫无疑问是每一家模型所发力的重点,我觉得我们做的方法可能会有几个区别:第一,即使今天 Coding 已经是最重要的事情,但是我们还是会强调体系的全面化,我始终认为要把 Coding 做好,其实需要远远不止 Coding 的数据,也需要聊天、推理,各种各样不同的东西,因为大模型最重要的点是泛化性。第二,很显然产品作用越来越重要,如何利用好线上回流,我觉得是一个每个模型厂商都在应对和思考的问题。这里刚刚积累很多 CoDesign 经验变得非常重要。第三,我觉得还需要更多想像力,无论是技术演进,还是产品演进,甚至下一个范式演进,我们需要做探索性甚至不确定性的工作。
汤道生:从产品侧,因为大家越来越多有 Token 焦虑的声音,Token 成本爆发式增长,我也听到很多客户甚至用户身边的同事们也在紧盯着积分消耗或者 Token 消耗,怎么可以让我们的模型在解决某个问题,或者完成某个任务,Token 效率贵高,我之前做过一些任务可能是不同方向,有些方向也都知道肯定走不下去的,但可能模型还会试,试完之后走不下去再试下一个,里面有什么可以 optimize 的地方让 Token 整体使用效率更高?姚顺雨:我觉得在中国讨论性价比更多讨论模型架构,但其实它是很复杂的体系,我觉得最重要的是首先是你的 performance,很多人跟我说,他最后发现用 OPUS 这样的模型比用更差的模型更省钱,因为更快的把这个事情做对了,也省得人的精力,最重要的事情是 performance,如果你的 performance 好,性价比是最关键的事情。尤其我觉得今年可能很多简单任务的 robustness 会变得更加重要,一次把相对简单任务做对,这可能是性价比更关键的部分,不仅是模型架构。第二部分就是成本它本身,性价比第一是性能,如果性能不好性价比无从谈起。第二点是成本,中国是领先于世界的,就是我们做大量工作优化我们的成本,成本可能最重要的事情是怎么用一个更小的模型把更高的价值任务做好,在这基础上架构创新,包括长文管理,脚手架有很多需要做的事情。如果我们做一个相对较小的模型,但是它比肩大模型性能,而且在大部分任务上做很强的 robustness,这可能在很多长程的上面提升一两个点的提升,可能在今天的中国更有价值。我很好奇,您觉得 Agent,你是什么时候意识到它是一个什么新的产品的机会,以及你现在认知是什么,你觉得现在我们离一个好用的 Agent bottlenck 在哪里呢?汤道生:我们做的 Agent,针对不同场景有不同的产品形态,在 Agent 设计上面,很大程度是发挥好模型能力,当然模型在迭代它能力越强 Agent 需要做的工作越来越少,我看我们好几个产品在过去这段时间是随着模型能力加强,我们可以把产品,把 Agent 做的更简化,更多的给模型提供更多不同的工具,创造更多的 skills,来让模型能够更高效的去完成任务,给模型提供更多的我们叫记忆,用户过去使用一些习惯,我们能提取出来的一些用户 preference 的信息作为上下文,在 Coding 环境有相关的 context 给到模型,在 Workbuddy 里边办公协作,做个 PPT,可能大家关注的内容或者该给到模型的 context 也会不一样。所以在我们做不同的 Agent,我觉得更重要是了解场景下什么内容,什么信息,是重要的,比较 relevant 的,能够跟模型配合好,让模型有它需要的信息,同时也发挥它的能力。姚顺雨:最近我们确实推出一些像 Workbuddy 口碑不错的产品,背后很多小团队在快速迭代产品,我其实挺好奇,相对于传统的产品研发,你觉得在新的 Agent 时代的研发和组织管理上,产品团队发生什么变化,你的思考是什么?汤道生:我前阵子在帮 Workbuddy 做一个组织发文,我看了一下他们那个非常扁平化的组织,跟我们过去的其他产品组织架构有很大差异,更多小团队三个人五个人,可能围绕某一个领域来做攻坚,而且有很多试验在里面,还要支持 Infra 做实验,让不同的小分队可以去探索然后再验证,因为试验大部分拿不到正向反馈,我们也要包容团队去试错,这种通过大量试验去提炼出对于用户流程,对于我们想要的这个结果有正向帮助,这个是我觉得今天做 Agent,做原生 AI 产品,这个组织形态要能够比较好去支撑。另外,原来可能有很多工程师有很多时间花写代码,但是今天毫无疑问他们这些工作可以交给 AI 了,所以我们会看到更多角色的融合,大家都是产品经理,都要去了解透彻用户需求,以及设计出我们想要的产品形态,每一个工程师更像一个有想法的 leader,驱动多个 Coding Agent,针对我们想要的产品需求去做研发、开发。同时要参与评测、测试,比较前置,也用好 AI 能力,把这些质量保证工作,对齐工作要做到前面来。我也想再问一下一个可能大家比较多讨论的一个问题,很多人都会提到腾讯慢,说在 AI 上面我们没有及时抓住一些机会,你觉得我们真的慢了吗?到底下半场是什么?你能再多说一下吗?姚顺雨:我觉得首先 AI 其实今天有两个重要判断,第一个就是说我们认为 AI 是一个短期的游戏还是长期游戏?在硅谷大家蔓延很多情绪,哎呀,e2 年后所有人都要失业,AI 要取代所有人的工作,我们要赶快赚 2 年钱退休。但很显然我们的判断 AI 是一个长期游戏,其实我觉得 AI 刚开始,下半场才刚刚开始,我不认为 ChatGPT 和 CloudCode 会是唯一的 super App,我觉得那是一个非常灰暗的世界,我觉得肯定会有源源不断新的机会诞生。可能今天就像是 70 年代 PC 刚刚产生的时候,我觉得还有很多很多事情需要做。第二个判断,它会是个更线性还是多元游戏?因为确实过去几年大家能看到的是 Pre-training、post training,然后 Agent,Coding Agent,似乎有一个非常清晰的主线,这个主线是所有人都在做一样的事情,都在 copy,这也是非常灰暗的事情。
但到底未来变得更单一还是更多元?我个人看法会变得更多元,毫无疑问 Coding Agent 生产力会变得更加重要,我觉得它是刚刚开始的事情,这个世界还有很多空间没有被填满,多模态、具身智能,很多很多新的事情都在发生,或者刚刚发生,所以从这个角度来说,如果我们认为下半场刚刚开始,可能确实不是完了。过去模型、产品做了很多探索,走很多弯路,我觉得这是正常的,你如果没有做过一个事情,第一次做肯定有曲折,但是我觉得可能更重要的事情是能不能诚实面对自己,能不能 Be Real,能不能够去看到 feedback 然后去改变,能不能够保持耐心,这个事情是下半场最重要的事情。汤道生:大家对于腾讯经常喜欢挑某一个点来批评,当然我觉得我们也很欢迎大家给我们提更高的要求。我们是一个非常多业态的公司,很多产品在很多的赛道,同时也有很多的团队在推进不同的项目、事情。所以毫无疑问,在这样一个复杂的组织里面有一些地方可能我们做得快了,有的地方做得慢了,有一些地方可能会做失败,在探索。所以我觉得这些提醒都非常好,我觉得确实有一些地方我们是可以做得更好,但是就像你说的,这是一个长跑,这是一个马拉松,腾讯还是有非常丰富的场景。
就你一开始提到选择腾讯,因为 AI 需要 Context,模型需要很多的这些上下文,其实腾讯在过去多年不同产品,在不同赛道的这些积累,其实都是可以针对每一个场景去为模型提供有用的信息,提供这些 Context 来发挥价值。在这样一个长跑,我相信模型会不断迭代,用户的需求也在不断变化,也会有新的产品形态出现,我觉得我们比如说今年年初对 AI 这一波热潮也反应比较快。同时也有像 WorkBuddy 这样的智能体产品,其实也是几年前开始做的产品,沿着原来做 Coding、CodeBuddy,慢慢看到非程序员也有很强的需求,我们也能比较快去应对,今天也听到很多客户对于我们的不同产品怎么去组合起来有非常高的期待。所以我们正在长跑中,也请各位多给我们提醒,给我们建议,也多用我们的产品来给我们正向的反馈。我看时间其实都超时了,我想我来首先感谢顺雨今天的分享,我们刚才其实围绕了做模型、做产品,谈到了 Co-Design,谈到了 Agent 的演进,也提到了组织变革,行业的一些机会,在过去一年其实我们看到非常多企业也有共同的困惑或者面临同样的挑战。产品如果用不好,企业不能持续去投入,或者 ROI 不够,这都会影响 AI 在企业里面普及的进度。为此,其实我们今天也会发布一套效率智能体的工具集,帮助企业可以更安全、更高效去部署应用的智能体。
第一是场景联接的能力,通过腾讯的微信、企业微信、元宝等等高频的场景触点,来把大模型嵌到真实的业务流,跟用户、数据、生态能够深度联接。第二是工程的驾驭能力,通过完整的 Harness 体系,让 Agent 能够稳定、可信、可持续运行,具备强大的 AI Infra,让包括高速的网络、高吞吐的存储,还有高性能的 Agent Runtime 来保证 GPU 的高利用率。第三是模型驱动力,依托混元大模型和模型产品 Co-Design ,兼顾实用性、性价比和 ROI。同时 ,我们也启动「腾讯 AI 共创营(二期)」, 携手 ISV、MSP 伙伴,一起共创行业解决方案,打造更多的标杆案例。接下来的环节,我的同事将围绕这些内容做进一步分享。今天下午我们将围绕个人、企业提效多个场景设置产品技术、行业场景与生态共创等多个平行论坛,以及 AI 产品发布专场,把 20 多个新产品、新能力介绍给大家。✉️ 邮件标题「姓名+岗位名称」(请随简历附上项目/作品或相关链接)
转载说明:本文系转载内容,版权归原作者及原出处所有。转载目的在于传递更多行业信息,文章观点仅代表原作者本人,与本平台立场无关。若涉及作品版权问题,请原作者或相关权利人及时与本平台联系,我们将在第一时间核实后移除相关内容。