GenFlow4.0,让通用智能体走进办公现场
昨天,我去了百度 AI DAY 现场。这次 AI DAY 的主角,是百度文库网盘联合推出的通用智能体GenFlow,正式升级到 4.0版本。

GenFlow 4.0是一个「全端通用智能体」,给用户提供通用化、个性化、主动化的智能服务,月活已经破亿。现在还在网盘中兼容了OpenClaw的能力。
听起来有点抽象对吧。
没关系。
现场有个 demo,给我一下子整明白了。
有个同学下午要出门见客户,但临走前还在赶材料。客户马上要见了,人已经快迟到了。
正常剧情应该是:坐在工位上疯狂翻文件夹;在微信里问同事;在客户楼下打开电脑热点继续翻。
但现场这个同学的操作很离谱,他把相关文件拖进百度网盘GenFlow的工作区。
然后。关机了。
对,直接关机,不带电脑,出门。
不是,你材料还没整理完啊???
更离谱的是,他拿起手机,直接给 GenFlow 发了一句话,大概意思是:
下午我要去见客户,帮我快速整理一下,上次跟他们开会的主要结论和待办事项,以及我们给他们的合作方案里的核心报价。
然后,网盘GenFlow兼容的龙虾就立刻开始从此前授权的工作区里读文件,整理出来的东西包括会议结论、待办事项、负责人、报价信息,甚至还顺手给了下一步行动建议。
人已经离开电脑了,电脑已经关了。但文件没有死在那台电脑里。
它被放进了一个 AI 能安全读取的工作区,然后在手机上变成了一份能直接拿去见客户的摘要。
看到这里,我突然意识到这次 GenFlow 4.0 讲的可能不是「AI 又会做什么新功能」。
它戳的是个更烦人的痛点:文件明明都在,但临到用的时候,还是得自己找找拼拼。不能精准快速地找到、用上。
是啊,我们的资料太多了。PPT 初稿、终稿、最终版、最终不改版一堆。Excel 表格、截图、PDF、Word 报告,各自躺在不同角落里。
但信息是碎的。
以前很多 AI 工具的思路,是你先把材料整理好,再上传给它。有种「它能做,但你得追着它做、教他做」的感觉。
GenFlow 4.0 这次做的是,不是你把数据搬到AI面前,而是让Agent直接进入办公现场。

不需要下载、不在电脑和 AI 之间当文件搬运工,给 Agent 授权好文件范围,AI 进入了一个有授权、有边界、能跨端调用的工作区,就开始干活儿,用户自然不需要背着电脑到处跑了。
顺着文件这件事往下看,Office Agent 就成了这次 GenFlow 4.0 的重点。

打工人最想甩给 AI 的活里,Office 三件套必须首当其冲:PPT,负责折磨审美;Excel,负责折磨逻辑;Word,负责折磨格式。
这老三样,苦打工人久矣。
先说 PPT 吧。百度现场嘉宾提到,现在 GenFlow 4.0 做出来的 PPT,已经高可用到可以直接给政府部门做 B 端售卖。
我当时:???
做过汇报材料的朋友应该都懂,政府 PPT 和普通 PPT,完全是两个物种。
它对格式的要求特别严格,标题、字号、缩进、边框、图框、页码、层级,全都要规范。
差一点,材料人就要手动拉一晚上对齐线。这才是 AI Office 的高难度关卡。
而 GenFlow 4.0 的 PPT Agent 已经在那种格式极细、规则极死、但真实工作里天天出现的 Office 阴间副本胜任了。
GenFlow 4.0 的 PPT Agent 有专业模式、创意模式和 PPT 美化三种模式。
专业模式更适合严肃汇报。
比如方案、汇报、论文展示这类场景,它不只是把文字塞进模板,而是会拆内容结构、生成标题和要点、统一版式,再把图表和层级关系一起组织起来。
创意模式更偏视觉展示。
比如景点介绍、活动展示、品牌传播这类任务,它会把图片、视觉元素、风格化排版融合进去,视觉冲击力更强。
但我觉得最打工人的,还是 PPT 美化。
老板丢来一个纯文字稿,内容别动,帮我美化一下,明天汇报。
就是这个场景,很多 AI 做 PPT 的问题就在这里。要么生成得挺好看,但不可编辑;要么能编辑,但丑丑的。
GenFlow 4.0 这次强调的是,尽量保留原始内容,同时优化排版、配色、层级和整体设计。
它会先识别旧 PPT 里哪些是标题,哪些是正文,哪些是数据,然后再把视觉重新排一遍。
这就很像一个合格的设计同事,知道哪些地方能动,哪些地方不能动。
但相比 PPT 格式,操作 Excel 更是办公地狱。
因为 PPT 做得不好,最多被说不够高级。但 Excel 做错了,一般就要准备罚款了。。
所以对 Excel,我最关心的就是:准。
这次 GenFlow 4.0 的 Excel Agent,重点就是处理真实办公任务。
用户可以用自然语言提出要求,比如识别实验数据并汇总成表格、保留三位小数、标注异常数据、统计季度增长率等。
系统还可以根据销售数据生成多 Sheet 表格,并进一步完成数据清洗、图表制作和区域销售分析。
任何一个环节翻车,表格就不能交。现场演示看下来,这个任务完成度相当高。
现场还放了一组 Office 任务耗时对比图:Word、PPT、Excel 三类任务里,GenFlow 4.0 的耗时都明显更短。尤其 Excel 任务,现场图里 GenFlow 是 1 分 12 秒,其他几个对照产品都在 1 分 30 秒以上甚至 3 分钟以上。
Word Agent 这次相对低调,但它其实承担的是另一个很常见的工作流:把前面 Excel 里的数据、PPT 里的资料等内容变成一份像样的正式文档。
现场演示里,Office Agent 可以把 Excel 里分析出的数据和图表,继续接到 Word 里,再生成完整销售分析报告。
这就比单点生成更接近真实办公。
Excel 做数据处理;Word 做报告沉淀;PPT 做对外展示。
这三件事接起来,才像一条办公流水线。但看到这里,其实还有一个更底层的问题没有解决。
AI 会做 PPT、会算 Excel、会写 Word,当然重要。可它要真正变成一个能长期帮你干活的“同事”,还需要一个稳定的工作环境。
它还得有地方放文件,有地方接任务,有地方沉淀结果,有地方回滚错误。
它得知道文件在哪,权限边界在哪,产物放回哪里;它还得能跨设备运行,不因为你电脑一关就跟着下班。
这次百度网盘给出的方案叫「独立工作区」。
用户在PC或手机上选一个文件夹作为授权范围,AI只在这个范围内读取和操作。手机和电脑共享同一个工作区,跨设备看进度和结果。
而且,这次百度网盘的GenFlow兼容了 OpenClaw的能力,简直是为打工人量身定做的“牛马虾”。
听名字就很打工人。这是给 Agent 准备工作环境,它能让 Agent 知道文件在哪里、工具怎么调、任务怎么跑、产物怎么管、出错怎么回收。
以前大家自己养龙虾,要搭环境、配工具、管文件、找产物;现在百度网盘想把这件事产品化,给个人用户和团队用户一个更省心的虾窝。
它背后的逻辑是:把 Agent 搬到数据里,比把数据搬到 Agent 里更现实。
百度团队认为,真正的工作就发生在网盘、文档、PPT、Excel、会议纪要、项目文件夹,以及一堆谁也不敢删的“最终版 2.0”里。
与其让用户把数据一份份搬到 Agent 面前,不如让 Agent 进入数据本来所在的地方,在一个有权限、有边界、有版本管理的环境里干活。
而百度网盘提供的这个现场里,天然就有文件、有权限、有版本、有跨端调用,也要有能长期运行的云端环境。

文库网盘GenFlow 4.0 这次想解决的,就是把这些散落的文件、工具和任务重新接起来。
文库这边,有专业文档、模板、报告、学术资料和 Office 能力沉淀;网盘这边,有用户自己的文件、权限、版本、跨端存储和协作空间。GenFlow 站在中间,把这些能力串成一个更顺畅的个人智能入口。
文库解决的是知识和模板从哪来,网盘解决的是文件和上下文在哪,GenFlow 解决的是任务怎么被理解、拆解和执行,OpenClaw 则让这套能力有继续接入更多 Agent 和工具链的空间。
百度文库网盘开始把个人智能这件事,放进一个更完整的文件和办公生态里。
这可能也是文库网盘这次想讲的核心——要让 AI 进入用户原本的资料、任务和流程里,把那些散掉的东西重新接起来。让人尽可能不再需要去服务 AI。


