前沿创业机会|奇绩在找这样的 AI 创业者 #1
在过去一段时间的奇绩社区内部分享和交流中,我们看到一些新的创新机会正在出现。
这些变化,来自真实场景、任务流程、数据闭环、系统结构与组织方式的变化。因此,我们将这些阶段性观察整理出来,分享给正在创业或寻找方向的创业者,为大家提供一些思路与参考。
值得关注的机会与方向
需要提前说明的是,以下提到的几类方向,并不是奇绩关注的全部,也不是一份标准答案。所有具备真实问题意识、深入真实场景的创业项目,都值得持续尝试与深入探索。
1. 行业级“行万里路”的 Agentic 数据管线
下一阶段稀缺的,不再只是模型能力,而是那些来自真实场景、真实任务、真实工作过程的数据与反馈闭环。
真正的机会,在“行万里路”——走进医院、工厂、律所、科研场景和企业内部流程,进入那些真正有人类活动、复杂任务持续发生的地方。围绕真实任务形成的数据闭环:任务如何发生、专家如何判断、系统如何执行、结果如何验证、下一轮如何修正。
谁能拿到这些模型公司拿不到的过程数据和反馈闭环,谁就更有机会建立下一阶段的壁垒。
2. 认知脚手架与智能体基础设施
值得关注的机会,也正在出现在智能体真正走向可用、可控、可验证的过程中。
围绕 Harness(执行体系)、Scaffold(认知脚手架)、Skill(能动性的最小单元)、Loop(持续优化的循环)、Context(上下文工程)、Evaluation(验证体系)展开的基础设施,正在变得越来越重要。
Scaffold 是认知脚手架,在问题还没想明白、系统还没稳定之前,先搭起支撑任务推进的结构;Skill 是能动性的最小单元,它决定系统如何找上下文、如何调用工具、如何完成任务、如何把结果写回记忆;Loop 则决定系统能不能持续迭代、持续优化、持续对齐人的需求。
真正重要的,是让智能体真正变得可控、可验证、可持续工作的系统。环境、评估、验证条件、训练闭环,本身就是新的产值,没有这些东西,智能体就很难真正拥有稳定的能动性。
3. 科学智能与 AI4S 的实验闭环
这一次变革,不只是写代码,更会进入数学、物理、生命科学,以及更广泛的知识生产与实验过程。
像蛋白设计、材料设计、科学实验这样的任务,并不是“对着模型说一句话”就能完成的。它需要训练环境,需要数据生成与组织,需要评估体系,也需要完整的训练系统和工作系统。真正的门槛,不只是模型会不会生成,而是数据从哪里来,怎样进入仿真环境,如何形成评估与反馈,如何持续优化。
围绕蛋白、材料、实验仿真、科研评估所建立的基础设施,就会成为非常重要的新机会。
4. 从 Judgment 到 Rule:把人的经验沉淀成规则
我们会关注那些处在高判断密度场景里的团队。
很多任务表面上都在处理信息,但本质并不相同。有些工作是规则驱动的,有些工作则高度依赖经验和判断。规则驱动的任务,更容易被模型快速覆盖;真正大的机会,反而在那些判断密度高、需要行业经验、场景理解和长期积累的地方。
能不能把这些判断不断沉淀成规则,把原本依赖专家的能力,变成可被系统吸收、复用和规模化的能力。谁能持续推动这种迁移,谁就更有机会在高判断密度的场景里建立长期壁垒。
5. 从 FDE 到 FDX ,新组织形态下的 AI 原生服务
我们也会持续关注围绕 FDE、FDX 和新组织方式展开的探索中。
过去,技术相对稀缺,所以很多创新的路径是先把技术做出来,再拿去市场试一试。但现在,情况正在倒过来。今天真正稀缺的,能够跨越“技术”和“需求”两岸,把一线场景中的真实问题,转化为产品、流程和系统能力的人。
这一轮变化真正被重构的,也不只是工具本身,而是人的认知、人的协作方式和组织结构。很多企业并没有准备好直接完成这种转变,因此大量机会会先出现在外部:外部团队先帮助企业完成 AI 原生重构,再逐步深入流程、深入组织、深入判断密度更高的环节。真正不容易被通用模型吃掉的,也恰恰是那些需要深度判断、需要重构组织流程的地方。

* 如果你正在做类似的探索,或者已经有一个想法想要继续加速推进,欢迎申请奇绩创业营。
这一次变化,本质是什么
过去一段时间,从对话,到代码,到智能体,模型越来越“会思考”。
但到今天,一个更重要的变化已经发生了。问题不再是模型能不能思考,而是它能不能“做事情”。这不只是语义上的区别,而是一次结构性的翻篇。
回看过去两个重要拐点:
互联网,让信息获取成本大幅下降;
ChatGPT,让知识获取成本趋近于零。
这一次的变化,是进一步往前走了一步:让“认知能力”开始具备执行能力。也就是说,AI 正在从:获取信息、生成答案,走向:理解意图、目标遵循、长程规划、工具交互。
我们在内部用一个更直接的词来描述它:能动性(Agency)。真正的变化,不只是模型更会说了,而是它开始具备进入任务、理解目标、调用工具、完成工作的能力。这也是为什么,我们会说:这一次,真正翻篇了。
为什么这件事这么难
很多人会直觉认为:模型再强一点,这件事自然就会发生。但现实并不是这样。但现实并非如此。因为这里存在一个基础矛盾:模型来自无限变化的分布,而人的需求来自有限而具体的上下文。
当你放任模型,它很灵活但不可预测;当你不断限制模型,它会变得稳定但又会越来越接近一个手工拼接出来的系统。这也是为什么今天很多 Agent 停在了一个尴尬的位置:Prompt(提示词)能做到 60%,RAG(检索增强生成)能做到 80%,再打补丁也难跨越 90% 的门槛。
真正难的,不是让模型回答得更好,而是让它在复杂任务里持续可用、可控、可验证。
真正的解法在哪里
这也是这次变化最关键的一点:Scaling(规模化)解决的是能力,不直接解决鲁棒性。
真正让系统“可用”的,不只是模型本身,而是模型之外的另一整层结构。也就是围绕任务执行建立起来的工作体系:
Harness:执行体系
Scaffold:认知脚手架
Skill:能动性的最小单元
Loop:持续优化的循环
Context:上下文工程
Evaluation:验证体系
模型只是大脑。真正重要的,是一套知道去哪里找上下文、如何调用工具、如何完成任务、如何验证结果、如何持续修正自己的系统结构。
编程:第一个被彻底重构的行业
如果观察这一轮变化,会发现一个非常明确的现象:最先被彻底改变的,是编程。
原因并不复杂,因为编程是少数上下文相对完整的工作场景之一。文件系统、Git(代码仓库)、任务结构、测试、部署,这些关键要素都在同一个空间里,可以被模型直接访问、直接使用、直接迭代。
也就是说,哪里上下文更完整,哪里智能就更容易率先落地。编程只是第一个被充分验证的行业,但它并不是特例。
它更像是在提前揭示一个普遍规律:当任务空间足够清晰、上下文足够完整、工具链足够可调用时,智能体就会更快进入工作流。
这也是为什么,编程的变化值得被反复研究。它不是一个孤立的应用案例,而是在更早地展示未来大量认知工作的重构方式。
真正的分水岭:行万里路
到这里,我们可以把 Scaling 简单分成三层:读万卷书(预训练)、想万步事(推理)、行万里路(真实任务)。
前两层,模型公司会持续领先。但第三层,开始出现一个结构性的机会:模型公司很难真正进入真实场景,是模型公司很难进入的“深水区”。因为数据不会离开本地、任务流程无法公开化、用户不会开放核心决策、组织复杂度很高。
凡是模型能通过“读万卷书”获得的认知,都不再是护城河。 “行万里路”会成为真正的分水岭。谁能进入真实场景,谁就更有机会拿到模型拿不到的上下文、经验和反馈闭环;谁能把这些东西沉淀成系统,谁就更有机会建立下一阶段的壁垒。
很多创业真正重要的方向,都是从一个具体问题、一个真实场景、一次持续验证开始的。
* 如果你已经有一个创业想法,可以通过申请表中的 20 个问题,系统性梳理自己的方向与判断;如果你还在找方向,也欢迎添加奇绩小助手,参与社区内部的创业问答(Open Group Office Hour),和奇绩校友、奇绩合伙人一起讨论与交流。

