AI工作平台“悟空”深度体验:实现了开箱即用,值得在生产力场景下使用

3月17日,我去杭州参加了钉钉2.0年度新品发布会,见证了阿里面向企业的全新AI工作平台“悟空”的发布。
“悟空”是一个AI驱动的智能体工作平台,让AI像真人助手一样操作你的电脑,帮你完成从简单到复杂的各种工作任务。
过去几天,我把“悟空”部署在主力工作的Mac Mini电脑上,并且给它开了最大的权限,并把它融入日常工作。
几天体验下来,我的结论是:
“悟空”已经做到了开箱即用,是一款值得在生产力的场景下使用的AI工具,但是真正用好它,依然有学习成本,需要在实际使用中不断总结经验。
下载安装和数据安全
“悟空”目前支持MacOS和Windows系统,直接在官网下载安装即可。

“悟空”初始封装的技能很丰富,免费Tokens也有,只不过”悟空“上面叫它”算粒“。用钉钉扫码登录,就可以直接使用。相比市面上的“龙虾”,“悟空”的上手使用门槛可以说再次降低。
由于面向企业客户,因此数据安全是尤其值得注意的事情。“悟空”运行在本地电脑上,利用本地算力,并且也主要在本地处理数据,因此数据安全上是值得信赖的。

“悟空”设置了安全等级,默认情况下只有部分“默认工作区”和指定文件夹的操作权限,但是如果你给它“安全访问权限”则释放了它的更多能力,比如自己打开浏览器、自己安装工具等,但是也有相应风险。为了更好体验“悟空”的能力,我给了它最高级别的“安全访问权限”。

我在Mac Air和Mac Mini上都部署了“悟空”,同一个钉钉账号都能登录,但是数据、工作任务等则完全不相通。
这种机制确实限制了使用体验,但是考虑到数据安全,这种机制又很有必要。因为,几乎全部企业并不希望员工在家里的个人电脑上接入工作场景的数据。
“悟空”的系统权限,主动权还是在用户手中。比如,“悟空”是否能够打开屏幕录制、打开摄像头等能力,用户可以选择开启或者关闭。同时,“悟空”也支持企业管理员根据用户级别设定数据访问权限等。
因此,从“悟空”的设计上来看,对企业的数据安全的考量还是非常多的。
我的3个应用案例
我用“悟空”深度跑了3个真实的工作流。第一:让“悟空”给我整理每天的AI简报;第二、让“悟空”检测标讯,并及时推送到我的钉钉;第三、帮我整理分析2025年的发票。
第一项目:让“悟空”给我整理每天的AI简报。
每日AI简报可以说是今天AI工具的基本能力。“悟空”安装之后就有这个初始能力,但是默认的提示词还非常简单,用它生成的第一版简报内容其实很不令人满意。

上面的截图是,我在Mac电脑上安装“悟空”后,跑出来的第一版简报内容。内容虽然也看上去像那么回事,但是时效性很差,内容也没能聚焦重要的AI科技公司或者高管。

但是调整完提示词之后,这个固定任务跑出来的效果就非常有质量了。

上面这张截图,是在新的提示词之后,“悟空”生成的一份简报,内容质量非常高。这直接节省了我每天一早去各大网站查看AI资讯的时间。
第二项目任务:让“悟空”检测标讯,并及时推送到我的钉钉。
智能超参数的公众号会每天发布一些重要的AI大模型标新给读者。很多时候,我都是每隔一定时间去几个重要的标讯网站看看,挑选一下。

过去几天,在工作的时候,我让“悟空”自己每隔30分钟去监控一次每日新增标讯,写入AI钉钉表格,把新增标讯的核心信息在钉钉上通知我。如果有重要标讯,我再打开网站去查看更为详尽信息,并且判断是否在公众号上发布。
从过去自己去盯标讯信息,换到今天让“悟空”去盯信息,其实节省不少精力,效率提升非常明显,同时每次监控,悟空花费的“算粒”成本也可以接受。
但是坦白说,我目前还是有一些“抗拒”这种效率的大幅提升。因为我感觉,这个过程丢失了通过自己看数据,让大脑进行“训练”的过程,可能导致无法有效捕捉很多标讯背后的“信号”或者说“洞察”。
这一点上,人的细腻的感知能力可能依然不能被AI替代。
第三项任务:帮我整理分析2025年的发票。
整理和分析发票是企业级的常见工作场景。我也让“悟空”去尝试去做了这项工作。在这次任务的体验中,我的感受也非常多。

第一次,我让“悟空”用旗舰模型跑了这个任务,它跑了20分钟最终完成了这项任务,最后的结果不错。但代价是,为了完成这项任务,“悟空”消耗了1061.1的算粒。
在测试这个任务之前,我升级了“悟空”高级会员,账户上新增了2000算粒。但是一个任务消耗这么多算粒,显然是很让人沮丧的。这“悟空”怎么能大规模用得起。事后分析,可能是我的提示词让旗舰大模型处理的任务还是太多了。

周六上午,我进行了第二次尝试。我调整了一些提示词,并且使用了“标准”模型,也就是智商水平最低的模型。

这次花费了11分钟,它“完成”了任务,消耗110.3算粒。处理速度提升了,消耗成本也明显下降,但是交付的结果很差,发票总金额明显有问题。

很快,我进行了第三次尝试,这次正好赶上“悟空”新版本升级。升级之后,技能中心出现了“发票检验与制单”功能。



使用这个发票相关的技能,我再次略微调整提示词,使用标准模型,这次3分钟左右就生成了表格,然后使用AI钉钉表格的“仪表盘”功能,直接实现了数据可视化。这次消耗了22.7算粒。相比前两次,结果更好,速度更快,而且成本大幅降低。

这就是三次“悟空”执行整理发票任务进行的时间和算粒消耗,消费记录明明白白。
使用感受和对“悟空”期许
过去几天,我让“悟空”主要完成了三项主要的任务,都跟我个人的工作密切相关。当然也跟“悟空”闲聊了几次,以了解了一些它的能力。
但是整个深度使用下来,有几点感受可以分享一下:
1、没事别跟“悟空”闲聊。由于今天大模型的处理信息机制,每次对话潜在输入的Tokens其实远比你在对话框中输入的提示词要多得多,并且会产生成本。
2、提示词非常关键。好的提示词才能充分调动“悟空”智能。今天“悟空”背后的大模型的智能水平已经可用了,但是实现产生符合预期的效果,还是需要把提示词写具体,写详尽,这需要有一个调试的过程。
3、具体任务,选择好不同智能水平的模型和技能。默认选择旗舰模型,当然是最简单的选择,但是今天而言,成本上还是非常高。用恰当的模型和合适的技能,能够以低成本低实现预期目标。换言之,杀鸡不要用牛刀,这不仅事关效率,也切实关系成本。
对“悟空”一段时期内的能力,我也有4点期许,主要跟效率和成本有关系:
1、鉴于今天大模型的使用成本还是很高,希望“悟空”能够支持本地电脑上的模型,可以本地和服务器端模型联动的方式来解决问题。
2、“悟空”能对任务消耗Tokens数量进行框算,让用户在下达任务的时候,能够心里有数。当“悟空”处理的任务达到一定规模的时候,我觉得这个功能应该可以实现。
3、根据用户下达的任务,“悟空”可以智能地调用不同智能级别的模型。今天,大多数用户对于任务该使用哪个模式是很困惑的,这个时候,“悟空”应该站在用户的角度上做出模型选择。
4、实现其他“龙虾”到“悟空”的快速迁移。很多用户应该在OpenClaw等”小龙虾“上沉淀了不少好的提示词、技能和固定任务等,应该可以有一键导入的能力,让“悟空”快速提升技能。
3月17日,我第一次安装“悟空”时,它的版本是0.8,第二天的版本升级来到了0.8.1,3月21日版本升级到了0.9.8。“悟空”在快速迭代,希望它未来能够成为企业级市场无所不能的“大圣”,为个体带来生产力的飞跃。
待到阿里“悟空”有更大版本升级时,我会再次分享使用体验。
觉得内容有收获,请您加个关注,标个星~ 谢谢您
