对话关梦龙:他想用 Agent 拯救你手机里的 100G 废片

作者丨成妍菁
编辑丨董子博

“以前二三十人做一款产品,以后是二三十人做三四十款产品。”
作为前字节跳动剪映早期团队成员,关梦龙在聊起 AI 带来的生产力变革时,抛出了这个近乎直白的结论。
在他看来,AI 让代码生产力实现飞跃,但这并不意味着创业变容易了。相反,当市面上的产品供给开始成倍“卷”起来的时候,真正的厮杀才刚刚开始。
关梦龙正在做的是一款定位为“表达助手”的 AI 编导产品“ Cutto ”。与直接“卷”视频生成的产品不同,这类产品不再只是提升效率,而是试图让 AI 直接参与甚至主导内容生成过程,人更多承担牵引和控制的角色。将小白用户的创作流程用Agent方式重新做一遍,提供创作者和自己Agent一个视频的个性化对齐工作台。
具体看 “Cutto” 的工作流程,就是通过复杂的 Agent 架构,小白用户只需像做选择题一样回答 4 到 5 个关于受众和调性的问题,系统就能在 3 到 5 分钟内,代写出一份精确到文案、音乐和景别的完整分镜脚本。
他选择跳出剪映这种偏向“提供高阶画笔”的纯工具逻辑,试图把创意和决策权真正交给 AI 。目前这款web产品研发接近尾声,预研版本的iOS产品已经上线App Store
就像我们能很多时候想表达丰富的情绪和想法,却无从下笔,Cutto像一个训练有素的写手,能够帮忙把这篇文章完整地代写出来还能抓住读者的兴趣。
聊到做这款产品的动机的初心时,关梦龙提到一则往事。很多年前,家中长兄准备出国,关梦龙曾剪过一支家庭寄语视频。后来全家人重新翻看这段影像,当屏幕里出现二十年前的面孔,那种被时间重新唤起的情绪,依然很直接。
因此,他一直想为普通人做一本能运行在 AI 时代的“回忆相册”和“表达手册”。
读研时期,关梦龙的研究方向是“计算机记忆系统”。他很清楚,设备里的数据只是被存储的信息,而人的记忆是立体的,往往带着具体的情绪。比如现实里大多数人的手机里堆满了升学、旅行、聚会的碎片化素材,但如何将它们缝合成一个动人的故事,仍然需要很高的创意门槛。
所以关梦龙更关心的是,能否把这些技术用在另一件事上——把表达门槛降下来,让更多普通人也能轻松整理并保存自己的记忆,将每一份情绪表达出来。
见面的那几天,他正在密集地见投资人。
在一个下午的时间里,我们聊了 AI 编导产品、字节剪映,以及当下的创业与资本市场。能感觉到关梦龙作为创业者的热情和坦诚,谈到当下的AI 创业火热期,关梦龙非常冷静:在他看来,很多人拿出一个功能就认为是在创业,但这其实离真正的创业还有一段距离,他认为创业是一段修行的道路,一个为世界持续创造价值的过程。
对于(PMF)的标准判断,关梦龙也保持着这份清醒的认知——产品是否跑通,不再取决于短期的数据,而是用户能否持续地使用。
在这之前,关梦龙的路径更偏向“标准技术人”,计算机工程出身,且有 10 年工作经验,本科毕业后,他在美国攻读研究生和工作一共八年,其间曾在Apple做软件工程师。
2020 年回国后,他加入字节参与剪映相关业务,这四年时间,也帮他完成了从纯粹的程序员向“技术产品”角色的过度,一手搭建起产品体验团队,通过技术手段优化剪映的留存与导出等核心指标,将体验做到了竞品第一。
目前,他的创业项目Cutto正在全力开发中,并上线了早期的预研版本。值得关注的是,现在已经有相关漫剧公司与关梦龙联系,并且融资方面也进展顺利。聊到最后,这位久经沙场的创业老兵也提到,“卷”是注定的,但自己在做的,是凭借技术和大模型时代的知识,帮大众展现自身的表达欲,这件事本身就值得他倾注全部心力。
以下是 AI 科技评论与 Cutto创业者关梦龙 的对话实录:
AI 科技评论:比起其他视频类 AI 应用,你们现在项目有什么差异化痛点?
关梦龙:从我的观察来看,现在视频赛道变宽,内容分类更广。观众偏好更细分,用户能力分层更明显。剪映立足的依然是偏专业的人群,虽然推出了“剪同款”给小白用,但本质上一个视频的好坏非常依赖人的判断,但是对于一个小白用户想把中长视频做得有趣有故事性让观众爱看,还有一定门槛。我们想做的是把优秀创作者的方法论在AI的帮助下赋能给小白用户,人在其中只需要提供idea和选择方向。所以我们做了创作风格层面的克隆,根据用户的素材理解之后结合灵感,把素材变成有结构、有节奏、有个人风格的视频故事。每个人都有表达欲,但很难把想法叙事成完整的创意。就像幼儿园小朋友有丰富的情绪但不会写作文,我们希望有一个类似老师的AI,能理解他的情绪并帮他写出来。我们的目标是让这种表达能力平权。
AI 科技评论:具体到产品落地上,交互流程是怎样的?大概耗时多久?
关梦龙:我们长远是做一个表达助手,现阶段切入的是“编导/编剧”功能。用户提供简单的想法(比如用影视飓风的创作手法去写pocket4的有趣评测),Cutto 会像编导一样从各个角度反问用户(比如受众是谁、想要什么调性),让小白用户只做选择题。我们争取在4到5个问题之内,让用户就能生成满意的脚本。整个流程大约在3到5分钟左右,最后会输出一个包含文案、台词、音乐、运镜和景别在内的精确脚本。如果你是先拍后剪的用户,Cutto也会先理解你的素材再结合编导的知识帮你编排。如果你有喜欢的up主风格,我们也会基于你喜欢的风格去编导做到风格的克隆。Cutto web产品正在研发过程中,当前上线了核心编导能力内部预研的iOS版。
AI 科技评论:目前调用的底层大模型是哪家?有包含视频生成功能吗?
关梦龙:暂时用比较擅长写作的模型,比如海外的Claude和Gemini。除了大模型,我们用了非常复杂的Agent架构来保障生成质量。视频生成会接入,但不是我们主打的能力,现在Seedance已经很好的帮助我们的脚本进行可控镜头的落地,我们希望用户在使用脚本时就有对齐预期的结果,从而减少视频的抽卡,进而减少小白用户的付费门槛。最终希望Cutto可以帮助每个人可以在互联网上有自己风格的IP,所以我们认为实拍内容是表达的核心,AI生成会成为辅助。
AI 科技评论:产品的目标受众画像是怎样的?商业化对象有哪些?
关梦龙:我们核心还是做To C的产品,希望解决普通人记录生活的痛点。 我们把C端用户分为三类:第一类,想做视频号、愿意投时间但不会做的人,比较典型的有刚起步的创作者,以及小品牌方运营自己的视频账号;第二类,没有变现预期,只想忠诚记录自己生活(如旅拍vlog)的人。我们能前置帮他们解决“去哪拍、拍什么、说什么”的问题,以及回来以后理解他的素材根据idea重新编排;第三类,完全的一键成片用户,对视频表达质量不敏感但是需要视频创作效率足够高、成本足够低。
目前我们主要服务前两类用户,第三类用户依赖端上模型能力变强,我们认为技术拐点还未到,所以我们先做好编导能力的打磨。To B方面,我们在奇绩路演完后,有一半找来的都是做AI漫剧的工作室。因为漫剧的写剧本(文案)和视频生成目前是两个割裂的环节,生成公司极度依赖精确的分镜脚本,这个痛点非常契合我们。此外,我们也在让MCN公司试用,帮助解决甲乙外加KOC三方需要用脚本沟通的需求。
AI 科技评论:现在很多AI创业者都在往 Agent 方向转型,您怎么看这个趋势?
关梦龙:其实这个关键节点其实发生得蛮早,在24年底。当时我看了Anthropic写的一篇关于Agent的论文,简单写了个Demo后发现,剪辑确实可以Agent化 。这其实是一个必然会发生的阶段,就像培养一个同事合作,早期需要更可控对齐预期,后期大家互相信任必然会放手让他自己决策一样。以前做AI,核心还是Workflow(工作流),决策权依然在人手里;但现在模型的智力够了,可以放手让agent来决策,而人需要不断牵引agent跟自己的风格对齐。这就是我们做Cutto的原因,是给人跟自己的agent对齐的工作台。
AI 科技评论:AI时代的产品经理和过去有什么不同?从技术转产品您遇到过困难吗?
关梦龙:差异还挺大的,或者可以说是完全洗牌了。以前产品经理一大部分工作是围绕需求文档和调研进行,但现在写代码能力极大普及,产品经理不再只是定义需求的人,而是必须“证明你的需求有价值”。甚至要在开发前,自己把Demo写出来去做用户测试。研发的快感来自于把东西实现,所以角色转变成产品经理后必须克制自己享受实现的冲动,转向纯粹的结果导向——关注这东西是否真正给用户交付了价值。幸好这个时代的技术人在使用AI和理解AI边界上还是有优势。能动性也是现在创业最大的优势。
AI 科技评论:听说您24年初刚出来创业时,做的第一个项目并不是现在的AI编导?
关梦龙:对,24年初做的第一个项目是做直播电商切片,底层解决的是素材挑选的问题,也就是剪辑赛道里的“粗剪” 。当时的问题是从众多素材里挑出视频要用的片段是很费劲的,而且那时(22、23年)还没有语义化搜索 。比如你想搜“蓝色的小狗”或者“书架上摆了一只毛绒玩具的书”,根本搜不出来 。当时想用技术解决素材整理和搜索的问题,后来海外直播电商并没有跑起来,在我们做了初步的用户调研之后发现我们这个需求做早了,就不做了。但是为我们在素材挑选的技术沉淀上做了很大贡献。
AI 科技评论:在字节剪映团队做的怎么样?
关梦龙:加入剪映前我在美国工作了四年。2020年回国加入剪映做了三年半,在字节一共待了4年。我算剪映早期的团队成员,我做的工作叫“技术产品”,这个岗位的好处是,只要是剪映的功能我都会涉猎,而不是单点在某个功能模块里,又因为技术出身所以可以挖掘出很多问题,像是产品和技术的翻译官。我自己负责搭建了“产品体验团队”,核心目标是在不增加产品功能的情况下,靠技术手段和用户行为挖掘来优化留存和导出等核心指标。比如我们优化了导出时长、APP打开时长,并且通过竞品评测,把产品体验指标从行业第三、第四优化到了行业竞品里的第一。
AI 科技评论:听说很多新的创业者第一天就把目标用户放在全球,这是现在的趋势吗?
关梦龙:对,这是最近创业的一个趋势。比如现在很多智能硬件都会选在海外作为先发市场,不仅能卖上价钱还可以印证是世界可接受的品质,然后再回到国内卖的策略。我们做 AI 产品也类似,海外用户的付费意愿相对会高一些。我们目标是海外用户所以会先用海外场景落地,搭建我们的编导系统。系统完备后会支持中国用户爱看的自媒体up主的编导思维。
AI 科技评论:最近很流行“一人公司”的概念,你怎么看?
关梦龙:这是我个人感觉,我认为“一人公司”暂就目前来看是个伪命题。虽然个人借助AI的形式和能力没问题,但在市场上依然势单力薄。一个人的精力有限,未来的组织肯定是“小而美”的。团队应该互相配合,每个人有自己的agent并且可以让团队其他成员使用。把每个人类似于“一人公司”的综合能力往外扩大,去触达更多需求,而不是真的只靠一个人单打独斗。
AI 科技评论:现在这个时代创业最大的难点是什么?对于AI时代的创业者素质,您有什么感悟?
关梦龙:曾经创业做产品都需要一个技术负责人或者CTO。但是我们现在看到的是很多非技术的人在AI的帮助下做出了非常棒的产品。所以我认为现在最大的难题是对用户需求的把握,以及如何让目标用户看到你的产品。其实就是增长和冷启动相关的命题,所以我们也一直在找增长负责人。
就我体验来说,在AI这个堪比工业革命的时代,以前的大厂经验或研发经验价值缩水很大,最重要的是这两年的学习增速和构建东西的速度。比如我现在发现产品bug,可以直接用手机描述问题发给“小龙虾”帮我修并提合并,研发效率是以前的10倍。AI的技术日新月异,只有亲手去体验和实践之后才会有新的认知。这种被惊讶到的感觉越来越频繁,就需要不断思考跟自己创业业务的联系和关联度,然后进行知识的迁移。所以学习速度成为了必备的素质。海外AI的先驱者不管是不是CEO都会开始用AI构建东西就是一个真实的写照。



为什么它石陈亦伦踏入具身河流

对话 DigClaw:每天消耗数十亿 Token,他们如何从弱信号中挖掘商机?

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!
公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。
未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!
公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。
