他用万相2.7给猫做了本日记,拿下「万相皆可 Skill」快闪赛第一名
在过去半年里,AI 影像生成模型的能力曲线被反复抬升。但我们更关心的是:
当模型已经足够强,普通人到底能用它做出什么?
带着这个问题,我们和万相一起,发起了「WaytoAGI 整活计划」第12期,主题是「万相皆可 Skill」。

我们希望大家做出来的,不只是一次性的生成效果,而是一个可以被调用、可以反复使用、还能继续升级的作品。
它可以有梗、有趣、好玩,也可以切进真实场景,解决一个具体问题。重点是把万相的能力,真正变成一个能反复使用的 Skill。
最终,这场为期两周的快闪赛收到了超1000份投稿投稿,共90人获奖,覆盖宠物、电商、医疗、游戏、教育、文化遗产、影视编剧、工业流程……几乎每一个你能想到的场景。
🏆 完整获奖名单:「万相妙思+」快闪赛,获奖名单公布!
6 件主奖项解决了哪些痛点
这6件作品横跨宠物 / IP / 游戏 / 心理学 / 电商 / 健康,每一件都为「万相皆可 Skill」提供了一个有说服力的样本。
🥇 一等奖|《毛孩子的日记站》— 谭轶骅

解决问题:上班族、出差党、加班党出门一整天,回家不知道毛孩子干了什么。市面上一堆摄像头厂商在做"监控",但没人在做"内容生成"。
实现路径:从 RTSP 拉流 + YOLOv11 行为检测、ONVIF 云台巡视抓拍,到多模态 AI(GLM-5.1)看图、万相 2.7 波普风生图、Python 模板引擎构建静态网页、再到 SSH 推 GitHub Pages,整条流水线打通。每日 72 次抓拍 × 8 天,已经累积 192+ 张插画。在线站点和 GitHub 仓库都已公开。
获奖理由:
是 4 份顶级作品里最"重"也最硬核的工程实现 产品定位精准:"Cat Daily 做的不是监控,是自动内容生成" 充分发挥了 wan 2.7 的角色一致性能力(固定形象 prompt + 杂志风封面) 作者承认"不懂代码,靠 codex / openclaw / stitch vibe coding 拼出来",对社区里同样想折腾硬件 × AI 的非程序员极有启发 商业叙事完整:宠物经济 3000 亿 + 细分用户画像 + 延伸买单方(宠粮 / 宠物医院 / 保险)
🔗 网站展示地址:https://emajjsky.github.io/cat-daily-site/
📄 Skill 文档:https://my.feishu.cn/docx/ZrP5d3qQuoWNkLx4r4JcSpmnnyc
💻 Github 仓库:https://github.com/emajjsky/cat-daily-public
🥈 二等奖|《Siri 万相 IP 系列化技能》— 李幸
输入一张 IP 图片:

输出 3D 建模三视图等各种图片:

解决问题:个人 IP 商业化是当下流量最好的赛道之一,但从一张原画到完整可商用的周边,中间隔着 8 道工序。
实现路径:把 wan 2.7 串成一条 IP 生产线:一张图 → 8 大类完整可商用成果。提供三种输入模式(纯文字 / 角色图 / 三视图),自动产出三视图、三风格、动作九宫格、文创、表情包、动态视频、HTML 展示页、ZIP 包。
获奖理由:跳出了"帮我画一张图"的单次调用思维,真正把 wan 2.7 串成了 IP 生产线。小黄鸭、长颈鹿、小姐姐、九尾狐多案例横向验证,"100% 成功率"是建立在可验证证据上的。
📄 Skill 文档:https://my.feishu.cn/docx/M9pzdDpMro0jUgxuaXScCd6qnch
💻 Github 仓库:https://github.com/siri-Lee001/Wan-IP-creator-skill
🥈 二等奖|《Wan-Game-Assets》— 笨笨

解决问题:独立游戏开发者在原型期请不起画师,但 RPG / 卡牌 / 平台跳跃 / 策略 / 休闲不同类型对资产的需求差异极大。
实现路径:
闭环工程化:DashScope API配置 → 异步任务轮询 → 参考图上传 → enable_sequential序列生成 → AssetDownloader自动分类落盘(characters/scenes/items/monsters/ui) 模板分层:Prefix + Content + Suffix 提示词结构,5 种风格 × 6 种游戏类型全部独立 JSON 用对了 wan 2.7 的"组图一致性"能力:史莱姆进化、双人对打教程 3 步分镜
获奖理由:"原型阶段美术成本降低 90%+" 的商业叙事站得住,是少数把 wan 2.7 真正"工程化部署"到细分行业的作品。
📄 Skill 文档:https://wxgthmc3q4g.feishu.cn/wiki/EhGrwZOzaiPaaAktpXacBMkhnpe
💻 Github 仓库:https://modelscope.cn/skills/benben2paopao/wan-game-assets
🥉 三等奖|《心理学概念可视化卡牌》— 谢耳朵

解决问题:小红书心理学赛道有海量需求,但传统科普卡牌信息密度低、视觉一致性差。
实现路径:
HOOK → BACKGROUND → CORE → EVIDENCE → IMPACT → ACTION 六幕叙事弧线,每张卡牌承担明确的情绪曲线 5 色严格系统(背景灰 / 系统绿 / 荧光粉 / 荧光黄 / 线条黑),文档里白纸黑字写"禁止出现任何其他颜色" 强制 web_search 6 个维度(学术定义 / 历史起源 / 流行病学 / 临床表现 / 神经机制 / 治疗方案)
获奖理由:把学术严谨性 + 传播学规律 + wan 2.7 的 HEX 精准控制三件事死磕到了底,6 张 2048×2048 成品 + 18+ 独立信息点,是小红书心理学赛道的爆款模板。
📄 Skill 文档:https://lcn55jgid8h5.feishu.cn/wiki/LC0uw5mzwigibnkVRtNcLeDcntf
🥉 三等奖|《ai-model-studio · AI 虚拟模特工作室》— 朱秀雨、曹文清

解决问题:电商找真人模特贵,AI 模特又"千篇一律",prompt 难写的问题。
实现路径:
两阶段角色一致性:Phase E1-E2 面部锚点 → E3 所有图生图基于锚点 8 层维度树:行业 / 品牌调性 / Campaign Mood / 模特类型 / 身份 / 外形 / 商业细节 / 造型系统 双模式设计:快速 2-4 问 vs 专业 8 维度,避免"一键不可控"和"问卷疲劳"两个极端
获奖理由:把"人物一致性"这个 AI 模特最硬的难题拆解得有层次。交付物完整:角色设定卡 JSON、prompt bundle、面部 / 发型变体、近 / 中 / 全身、三视图、场景融合图。
📄 Skill 文档:https://my.feishu.cn/wiki/NgEawWFQOifMWEk3VBEcnwDFncb
💻 Github 仓库:https://github.com/xyzhu33/ai-model-studio
🥉 三等奖|《Aura Health Profile · 奥拉健康档案》— 戴嘉玮

解决问题:60+ 人口 3.1 亿,75.8% 的老人被慢性病困扰。资料管理困难、焦虑无助、孤独负担,这是中国社会最硬的刚需之一。
实现路径:
三种工作模式:build 首次构建 / update 增量更新 / brief 复诊简报 Qwen + Wan 双模型协同:Qwen 做内容理解与整合,Wan 做可视化简报 "复诊简报漫画"形态对老人尤其友好,比冷冰冰的 PDF 高几个段位 已部署 DeskClaw / ModelScope / 云端龙虾多端,参与通义端侧挑战赛
获奖理由:关注当前社会面临的主要问题,结构化沉淀(化验趋势 / 检查结果 / 用药信息)让 wan 2.7 的可视化有了真东西可渲染。
📄 Skill 文档:https://u1hk68mdmio.feishu.cn/docx/RNfWddLTkof45rxeYBdcUebsntg
💻 Github 仓库:https://github.com/Cartmanfku/aura_health_profile
以上就是6项主要获奖作品的介绍。
此外,还有24项优胜奖的作品,我们也都收录到了知识库中,复制链接打开,可查看详细作品信息:
🔗 https://waytoagi.feishu.cn/wiki/HGaEwgx3RimDjXkq7ricqLWznVb

本次万相活动,我们也延续了 WaytoAGI 一贯的共学模式:以赛代练。先教会大家怎么做,再在比赛中检验学习成果。
整个赛程被设计成 教 — 练 — 赛 — 评 四段式,从4月2日到17日,整整16天,让没接触过 Skill 的小白也能跟上。
这次整活计划不只是一场评比,更是一条从0到1的产品教学线。
而支撑整条链路的,是一份反复被强调的认知共识:
成熟的图片类 Skill,一定是流程型,而不是一句话型。
围绕这条主张,参赛指南把每一份成熟 Skill 的共性流程拆成了七步:
启动询问 → 搜索资料 → 提炼价值 → 模块拆分 → 生成内容 → 用户确认 → 生图执行
得分高的 Skill,从来不是 prompt 写得多花哨,而是把万相 2.7 真正工程化了。一条从输入到输出的闭环,任何人都能直接调用。
关于这场比赛
回过头看这场快闪赛,最让我们感动的不只是作品本身,而是这些作品背后的人。
一群分散在不同城市、不同行业、不同人生阶段的普通人,因为一道命题聚到一起,认真地把万相 2.7 拼成了一个个属于自己的 Skill。
万相做对的事,是把影像这件事的门槛往下压。多图融合、风格迁移、局部编辑等,这些过去只有专业团队才能驾驭的能力,现在每个普通人花十块钱开通百炼套餐包就能用。
它没有取代摄影师、设计师、动画师,但它让那些被预算、门槛、工具壁垒拦在外面的人,第一次拥有了完整的影像表达能力。

而 WaytoAGI 在做的另一件事,是把 AI 从认知压力变成实操路径。
我们做共学直播,是因为我们相信,再厉害的模型,如果普通人用不上,能力就只停留在 release notes 上。
WaytoAGI 三年时间做过太多场共学直播,从最早一起拆 ChatGPT 的能力边界,到一起摸 Midjourney、Sora、可灵、即梦、Runway,再到今天一起跑通万相 2.7 的 Skill 化路径……
这条路上我们陪很多朋友走过同一个轨迹:从不懂 AI,到用上 AI,再到靠 AI 赚到自己的第一桶金。

社区朋友梦飞记录了自己赚第一桶金的经历:如何在AI时代,赚到自己的第一桶金 | 2050分享
这些故事我们一个个见证过。新的一岁,我们也会继续走在通往 AGI 的路上,让更多人因 AI 而强大。
错过直播,这里补课!
万相三场直播,我们都整理了完整的智能纪要,没赶上的同学可以直接跳进去看回放精华。
共学直播中已经把背景、规则、案例等全部讲清楚了,跟着补课就能从零开始动手做自己的 Skill。
📚 4月2日 共学日:https://waytoagi.feishu.cn/wiki/DvzqwXHlNipLnDkqV3scx86JnNe
(项目背景、共测规则、Skill 是什么、如何调用万相 2.7 的 API)
🎯 4月8日 黑客松启动日:https://waytoagi.feishu.cn/wiki/QIBHwa3AOiGAPKkZlhHcbVignme
(Skill 案例分享、从想法到成型的路径、赛事规则)
⚡ 4月12日 一小时在线快闪:https://waytoagi.feishu.cn/wiki/BsVYwh2ipidMl0kWBdgc3La6nid
(现场公布主题、限时创作、龙虾自动化评审、当场颁奖全过程)
「万相皆可 Skill」不是一句口号,当 1000+普通人花两周时间,把万相 2.7 拼成了无数个新工具,这道命题就已经被回答了。
感谢万相对本次赛事的支持,感谢全部参赛者、共学者、传播者,你们才是「万相皆可 Skill」这道命题的答案。
