Z Product | AI Native教育产品爆火:海外播放破5000 万,20岁天才退学联手前Google专家打造


图片来源:videotutor.io
Z Highlights
几天内席卷 Instagram 与 TikTok,海外播放突破 5000 万;用户可上传题目、选择喜欢的 AI Tutor 角色,并实时互动生成个性化视频讲解,让学习像刷短视频一样停不下来,验证了 AI-native 教育产品的新形态。
基于超 10 万数学图形数据训练的自研 PDGP 模型,结合 LLM 与 自研 Canvas 数学动画渲染引擎,把题目理解、图形解析、推理路径和动态讲解整合为实时互动视频教学,显著提升 AI Tutor 在复杂 STEM 场景中的精确度、稳定性和可解释性。
以Freemium免费增值模式快速跑通ToC付费转化,B端API获全球超1000家教育机构合作请求,验证ToC+ToB双轮驱动的可持续商业闭环。
01 当数学题被做成学生愿意转发的短视频
近期,一款名为VideoTutor的产品在海外社交媒体上引发关注。真正让 VideoTutor爆火出圈的,不是传统的那种 AI 解题演示,而是一种更像短视频、更有梗、更好玩的学习体验。在 Instagram 和 TikTok 上,学生上传三角函数、几何、物理等题目后,可以选择不同风格的 AI Tutor 角色来讲解。有人让公共人物风格角色一本正经地讲数学,有人选择动漫人物、猫咪形象,也有人自定义熟悉的人物角色来做自己的“专属老师”。

图片来源:businessinsider
有用户上传特朗普风格角色讲数学,也有用户选择自己喜欢的网红数学博主来做讲解,相关视频在 Instagram 上迅速突破百万播放。
这种体验之所以能击中海外年轻人,本质上是因为它非常符合美国 05 后熟悉的社交文化:在 Roblox 利用虚拟身份互动,在 TikTok 上用梗和角色完成表达,在 Instagram 上分享有趣、反差感强的内容。VideoTutor 把这种年轻人熟悉的内容逻辑带进了学习场景——用户不再只是被动观看一段标准课程,而是可以上传自己的题目、选择喜欢的角色,并通过语音按钮继续实时追问。AI Tutor 就像真人老师一样,根据学生的问题即时回应、即时演示,并生成新的个性化视频讲解。
VideoTutor 实际上重构的不是“解题效率”,而是“学习的表达方式”:它把做题这件事,转化为一种可参与、可定制、可传播的内容体验,让学习第一次具备了接近短视频与虚拟社区的社交扩散能力。
02 高价私人辅导之外,AI Tutor 的市场缺口
VideoTutor 的爆火踩中的是一个更大的教育市场缺口:在全球 EdTech 与 AI 教育交汇的千亿美金级市场里,高质量、个性化、可互动的辅导体验仍然长期稀缺。
尤其在美国,私人辅导一直是一门高客单价生意。2025 年美国私人辅导市场数据显示,SAT 备考导师平均时薪约 62 美元,在纽约、旧金山等教育竞争激烈的城市,精英导师价格甚至可达数百美元一小时;而数学、物理、编程等 STEM 学科,因为更依赖一对一讲解和动态推导,也长期是普通家庭难以持续负担的教育支出。
但这个市场真正的痛点不只是“贵”,而是优质教学能力很难规模化。
一个好的真人老师,不只是告诉学生答案,而是会根据学生的反应不断调整讲法:哪里没听懂,就换一种解释;抽象概念讲不清,就画图、举例、拆步骤;学生继续追问,老师也能即时回应。这种围绕学生理解状态展开的动态反馈,才是一对一辅导最核心的价值。
上一代 EdTech 解决了“内容在线化”,却没有真正解决“个性化教学”。录播课可以规模化,但无法回应每个学生的具体问题;题库和拍搜工具可以快速给出答案,却很难解释学生为什么卡住,更无法像真人老师一样持续追问、调整节奏和换一种方式讲清楚。

图片来源:sevalla
从市场来看,VideoTutor 面对的也不只是 SAT 或数学搜题,而是更大的 千亿美金级 AI 教育机会。Grand View Research 预计,全球教育科技市场规模将在 2030 年达到 3484.1 亿美元;Precedence Research 则预测,全球 AI in Education 市场将从 2025 年的 70.5 亿美元增长至 2035 年的 1367.9 亿美元。
在美国,私人辅导同样是一门高客单价生意。Wiingy 对 5 大平台 3600 名导师的分析显示,2025 年 SAT 备考导师平均收费为 62 美元/小时,数学辅导平均为 46 美元/小时,部分竞争激烈城市的考试辅导价格甚至可超过 300 美元/小时。
所以,VideoTutor 真正押注的不是“AI 解题”,而是下一代 AI-native 教育产品的入口:K-12 学习、STEM 教育、标化考试辅导、教育硬件、内容平台和机构教学系统,都需要一种能够实时理解问题、生成讲解、持续互动的 AI Tutor 能力。
在用户侧,VideoTutor 把 AI Tutor 的使用门槛降到极低:学生上传题目后,只需选择喜欢的讲解角色,就能进入一场像真人老师一样的实时互动视频辅导。
问题输入与智能解析: 学生上传题目图片或输入文字问题后,系统通过几何解析器与几何图形深度学习模型,识别题目中的文字、公式、图形元素及其空间关系,将原本非结构化的题目信息转化为带数学约束的结构化逻辑,为后续推理和动态讲解生成打下基础。

图片来源:videotutor.io
实时互动问答与趣味化讲解: 在题目解析完成后,学生可以选择喜欢的 AI Tutor 角色进入互动讲解。AI Tutor 不只是输出答案,而是像真人老师一样通过视频、语音、动画和白板演示进行实时回应;学生可以随时追问、打断或要求换一种讲法,让原本枯燥的 STEM 学习变成更有角色感、互动感和趣味性的个性化辅导体验。

图片来源:videotutor.io
03 重构动画渲染协议,打造不可复制的数据飞轮
在AI教育赛道,功能可以快速模仿,但工程确定性与数据闭环无法速成。VideoTutor 的护城河,并不体现在某一个孤立的技术点上,而是被嵌入进产品运行的每一个关键环节,形成一套外部难以短期追赶的系统能力。
一个典型的切入点,是它对“图形”的理解方式。传统 OCR 可以识别文字,却很难真正读懂几何题中的结构关系——点、线、面、圆以及它们之间的约束,本质上是一种带逻辑的空间表达。VideoTutor 在这一层引入了自研的几何图形深度学习模型,通过大量数学图形数据训练,将题目中的文字、公式与几何元素转译为带有数学约束的结构化信息,使 AI 不只是“看到图”,而是能够理解圆心、半径、角度关系乃至辅助线背后的推理路径,这也成为后续讲解生成的基础。
在此之上,VideoTutor 并没有选择走一条偏“视觉生成”的路径,而是进一步自研了一套面向数学场景的动画渲染引擎。与通用视频生成追求“像不像”不同,数学教学对表达精度有着更高要求——一个点的位置偏差、一条线的方向变化,甚至公式呈现的顺序,都会直接影响理解效果。因此,这套引擎更接近于把解题过程“程序化”:将推理步骤拆解为白板演示、公式展开与图形变换,让 AI Tutor 能够像真人老师一样边讲边画,在保证严谨性的同时,完成动态、可解释的表达。
如果说前两者解决的是“能不能讲清楚”,那么持续互动过程中沉淀的上下文,则在回答“能不能越讲越贴近这个学生”。与传统拍照搜题的一次性问答不同,实时视频讲解会不断积累关于用户的细粒度信息:他们上传过什么题目,偏好什么讲解风格,在哪一步停下来反复追问,在哪些知识点上持续卡顿。这些信号不会消失,而是被纳入到系统中,逐步形成对个体学习状态的刻画,使得后续每一次讲解,都建立在既有理解基础之上,而非从零开始。
也正因此,VideoTutor 的壁垒并不是单点突破,而是一种由图形理解、表达引擎与用户记忆共同构成的复合系统。它让 AI Tutor 从一个“给答案”的工具,转变为一个在互动中不断演化的讲解者,越使用,越接近一个真正理解学生的老师。
04 极客别墅里的“动量为王”
硅谷的创业传奇,往往始于一间小小的办公室,而VideoTutor的故事,发生在加利福尼亚州桑尼维尔的一栋独立别墅里。这个规模极小但人效极高的团队代表了一种典型的硅谷式创业范式:强调速度优先、技术驱动,以及对用户体验的持续贴近。而“动量为王”,则是他们刻在骨子里的信条。

图片来源:36kr
团队的核心是两位高度互补的创始人,分别负责产品战略与技术落地:VideoTutorCEO & 联合创始人赵凯(Kai Zhao),是一位20 岁的华裔连续创业者,小学三年级自学编程,大一开发校园社交 App 获 20 万美元融资,大二参与创办 MathGPT Pro 并入选奇绩创坛,大三从圣何塞州立大学退学投入 VideoTutor 创业。他亲身经历了海外教育资源的分配不均,对学生的真实需求有极致的 “深共情”,是产品方向、团队文化与融资的核心推动者,也是 VideoTutor “教育公平” 使命的践行者。

图片来源:Linkedln
CTO & 联合创始人James Zhan是前 Meta 与 Google AI 高级专家,拥有十余年大规模分布式计算、企业级 API 开发与 AI 系统构建经验,主导了 VideoTutor 从 0 到 1 的后端渲染管线、多模型共识架构、自研几何解析器等核心技术的落地,为年轻的创业团队补上了大厂级的工程能力,确保产品的技术确定性与可扩展性。

图片来源:Linkedln
除了核心技术岗位,团队还吸纳了教育学专家和顶尖学术精英组成的数据标注团队,所有人同吃同住在别墅里,最大限度降低沟通成本。正是这种“极客别墅”式的开发模式,让他们能在短短两个月内完成产品从0到1的构建,实现快速的产品迭代——而这,正是硅谷创业公司在早期最核心的竞争力。
“只有保持小团队规模和降低沟通成本,才能确保产品快速迭代。”赵凯的这句话,道出了团队的生存逻辑。在AI技术快速迭代的当下,速度就是一切,而这支兼具年轻活力与大厂经验的团队,正是VideoTutor保持“动量”的核心保障。
05 完成1100万美元种子轮融资,赵长鹏家族办公室YZi Labs领投
我们了解到,VideoTutor完成了1100万美元的种子轮融资,这轮融资由赵长鹏家族办公室YZi Labs领投,这也是YZi Labs首次进军人工智能软件领域;锦秋基金(字节跳动背景)、BV百度风投、Amino Capital、BridgeOne Capital等机构跟投,集结了“加密资本+互联网大厂+硅谷早期基金”豪华投资方矩阵。
在2025年的资本环境中,一家由学生主导的初创公司能获得投资人本身就是一种认可。VideoTutor的这轮融资,不仅是资本对其技术和模式的看好,更源于赵长鹏(CZ)的教育使命与产品初心的高度契合。

图片来源:Crunchbase
各投资方的入局,均有明确的战略逻辑:YZi Labs为VideoTutor带来品牌背书与全球化视野,更与CZ的非营利教育项目Giggle Academy形成协同,二者都以“利用技术消除教育资源不对等”为核心使命;锦秋基金能为其提供短视频分发与算法增长的指导;BV百度风投则让其获得深度学习与基础模型领域的资源支持;BridgeOne Capital则助力其B2B业务的规模化拓展。
专注于把产品做好,不要急于赚钱。”这是 CZ 给赵凯的建议,也让 VideoTutor 在早期更专注于打磨实时互动视频教学体验。随着 TikTok 等海外社媒播放突破 5000 万,VideoTutor 不仅在 C 端获得学生自发传播,也在 B 端收到来自腾讯、小天才等教育生态客户的采购和部署咨询,以及超过 1000 家机构的 API 集成请求。 它的潜力正在从一个 AI Tutor 应用,延伸为教育机构、内容平台和智能学习硬件可接入的 AI 教学基础设施。
之于未来,VideoTutor不只是想做更好玩的 AI Tutor,而是致力于把实时互动视频生成扩展成下一代 AI-native 教育基础设施。今天,学生可以上传题目、选择喜欢的 AI Tutor 角色,并通过实时互动获得个性化视频讲解;未来,这种能力将从数学拓展到物理、化学、编程等更多 STEM 学科,从单次解题走向长期学习路径、能力评估和上下文记忆。
随着实时视频生成、语音互动和视觉化讲解能力成熟,VideoTutor 也有机会从 C 端学习工具,延伸到教育机构、内容平台、智能学习硬件和学校系统,成为更多教育产品背后的 AI 教学引擎。
如果上一代 EdTech 是把课程搬到线上,那么下一代 AI 教育,就是把“好老师的讲解能力”实时生成出来。VideoTutor 想抓住的,正是这个从数字化内容到智能化教学代理的转折点。






