26年7月1日,全球AI资讯约15条:DeepSeek V4 正式版上线 工作时段涨价一倍、AI Agent评估公司Patronus AI融资5000万美元等

昨日,AI领域发生了多项重要事件和进展,共计约15条汇总如下。
AI应用进展和演化
1-1. 破天荒!DeepSeek V4正式版居然要涨价,而且翻着倍地涨
DeepSeek V4正式版即将上线,但迎来其创立以来首次涨价——仅在高峰时段API价格全面翻倍:输入(缓存命中/未命中)和输出token单价均×2。非高峰时段仍维持“地板价”,延续其“价格屠夫”口碑。此次调价并非单纯盈利导向,而是应对算力压力的务实之举:公司正加速自建数据中心,已在乌兰察布布局,并密集招聘IDC设计、超算集群等基建人才。
与此同时,V4能力确有升级:支持百万级上下文,但用户反馈仍存三大痛点——幻觉率偏高、长程推理稳定性不足、复杂代码任务保守或误报bug。此外,原生多模态仍是待补短板。简言之:涨的是高峰时段价格,不涨的是技术野心;贵了一点,但更强、更稳、更值得期待——毕竟,连“便宜”都要靠硬核基建来守护。https://www.qbitai.com/2026/06/440162.html

1-2. 中国第一,直逼OpenAI!神秘「扫地僧」冲到全球前七
最近,一个神秘AI团队“MopMonk”横空出世,在全球最严苛的AI网络安全评测平台CyberGym中杀入全球第七、中国第一,成功率高达73.1%,仅微弱落后于OpenAI。令人震惊的是:它没有官网、无官方宣传、团队身份成谜——连名字都取自金庸笔下深藏不露的少林高僧。
CyberGym由伯克利团队打造,堪称“AI安全界的奥运会”:测试基于1507个真实历史漏洞、覆盖188个开源项目,要求AI在百万行代码中自主推理、生成可复现漏洞的PoC,全程离线、无外部辅助——考的不是“知道”,而是“做到”。
其制胜关键在于一套自研的“安全Agent Harness”:通过结构化漏洞记忆、记忆驱动迭代、多Agent共享探索三大设计,把大模型的“智商”高效转化为实战“行动力”。https://www.163.com/dy/article/L0M43RGM0511ABV6.html


1-3. 刚刚,OpenClaw和Cursor杀入手机!Agent从此塞进口袋
AI真正“走出电脑”,走进口袋!6月29日,OpenClaw与Cursor同日发布原生iOS/安卓App,标志着AI Agent首次实现“掌上全功能运行”。OpenClaw(被黄仁勋称为“个人AI操作系统”)主打本地优先、隐私可控:所有密钥和配置存于用户设备,免费版每日支持20条Gemini消息,付费20美元/月享无限使用;它能调用相机、定位、日历等硬件权限,在地铁、咖啡馆一键审批邮件、提PR。
Cursor则聚焦开发者场景,其iOS测试版支持语音启动云端Agent——无需开电脑,手机即可发起代码修复、自动生成可合并PR,实测任务最长可自主运行24小时。二者共同指向一个转折点:AI不再依赖工位,人走开、Agent照常干活,只需手机弹窗提醒“该你拍板了”。https://www.163.com/dy/article/L0LO9SLG0511ABV6.html


1-4. 半年不写代码,Claude Code之父:3年后写代码的人暴涨100倍
AI正在重塑编程工作,但不是取代程序员,而是“融化”传统岗位边界。Anthropic的Boris Cherny(Claude Code之父)坦言:自己半年没写一行代码,100%依赖AI生成;他预测,“软件工程师”职称将在一年内淡出,三年内用智能体写代码的人数将达今天的100倍。关键转变在于——衡量开发者不再看头衔,而看“你此刻扮演什么角色”。
他提出五类动态角色:原型师(冒点子)、构建者(搭系统)、清理者(删冗余、修隐患)、增长者(优化PMF)、维护者(保稳定)。其中,“清理者”最被低估却日益关键:当AI让代码生成变得廉价(2026年初至今,未经人工评审直入生产的AI代码比例从7.0%飙升至38.5%),兜底、判断、担责的人反而更稀缺。https://www.163.com/dy/article/L0LO9B700511ABV6.html

1-5. 做视频不花钱、一句话搞定大纲分镜,Agnes AI 推全新免费视频创作平台 Pavo
新加坡AI公司Sapiens AI近日宣布重大免费开放举措:其核心全模态模型Agnes AI面向全球开发者和创作者无限期免费开放API,涵盖文本、图像、视频三大能力。目前提供三款主力免费模型——文本模型Agnes-2.0-Flash、图像模型Agnes-Image-2.1-Flash、视频模型Agnes-Video-2.0。
更重磅的是,他们同步上线全新视频创作平台Pavo,主打“一句话成片”:用户只需输入一句需求,系统便自动完成创意构思、大纲生成、角色/场景/道具设计、分镜绘制、关键帧生成,直至输出分镜短视频,全程可逐步检查与微调。据官方透露,即将发布的Agnes-Video-2.5-Preview在动作流畅性、角色一致性、镜头运镜和场景连贯性上显著提升,内部测试已接近Google Veo 3水准。https://www.1ai.net/54368.html

1-6. 闲鱼内测「鱼买买」「鱼卖卖」,AI 能让二手交易少一点废话吗?
数据显示,超70%的二手交易卡在“问不清、说不明”的环节:买家要反复确认屏幕是否原装、电池健康度、维修记录;卖家则苦于拍照、写描述、定价难——近6成用户因流程繁琐放弃上架闲置。
为此,闲鱼已上线智能相机识别估价,并内测“鱼买买”(买家助手)和“鱼卖卖”(卖家助手):前者可比价、提示风险、自动追问关键信息;后者能一键生成带瑕疵说明的商品描述,参考近期成交价给出建议售价。
但雷科技指出,技术亮点之外更需警惕“AI包装职业卖家”——当前平台上约40%热门数码商品实为批量铺货商家,却伪装成“个人自用”。因此,AI的真正价值不在帮双方“吵赢”,而在于推动信息标准化:自动标记卖家身份、结构化呈现维修记录与配件清单。https://www.ofweek.com/ai/2026-06/ART-201717-8110-30692652.html

AI大模型算法、赛事和会议
2-1. 全球首个:隐空间世界模型,打通长时序双向物理因果链了!
无界动力这家成立仅一年的具身智能新锐,发布了全球首个“长时序双向物理因果链”隐空间世界模型MWA™,让机器人真正开始理解物理世界——不是死记动作,而是像人一样预判“用力大小、水会不会洒、杯子会不会碰倒”。
其核心突破有三点:一是跳过像素,直接在隐空间建模,用“潜动作”自动从视频中提炼物体受力与变化的本质;二是首创正逆双向动力学协同机制,边推演后果、边反推原因,再互相校验,大幅提升因果推理精度;三是支持10秒以上长时序连续推演,显著抑制误差累积。实测中,MWA™在斯坦福等联合发起的RoboCasa权威榜单拿下全球第一,任务成功率75.2%,超英伟达GR00T-N1.6等主流模型。https://www.qbitai.com/2026/06/439891.html



AI基础设施方面(硬软件、数据)
3-1. Agent 刚拿到自己的邮箱和钱包,人类的收件箱已经挤爆了
腾讯近期上线的“Agently Mail”标志着AI正式获得独立数字身份——它不是帮人管邮箱的助手,而是给AI发专属邮箱,让Claude等Agent能以自身名义收发邮件。每人可注册2个Agent邮箱,内测期日发送上限50封。
安全是出发点:Agently Mail采用完全隔离+两阶段确认(AI先生成摘要,人确认后才执行),并防御Prompt注入。但更深远的是,它开启了AI作为通信主体的新范式:AI可注册GitHub、收验证码、甚至自主完成A2A(Agent-to-Agent)询价与订单对接。
与此同时,现实已悄然转向:截至2025年4月,全球51%的垃圾邮件由AI生成;2025年12月,AI钓鱼邮件暴增14倍;AI写邮件成本降低95%,回复率逼近人类(4.1% vs 5.2%)。https://m.163.com/dy/article/L0K7V1VL05119FMA.html

AI人才和资本动态
4-1. 估值泡沫、债务高悬!明星资本背书下的数说故事IPO含金量几何?
数说故事冲刺港股IPO,表面光鲜,实则“雷声大雨点小”。公司于2026年6月递交招股书,获小米瀚星、顺为资本联合加持,Pre-IPO估值达50亿元,但亮眼光环下暗藏多重硬伤:8.66亿元优先股赎回债务迫在眉睫,账上现金仅6617万元,远不足以覆盖短期偿债缺口。
另外,毛利率连续4年下滑,主因是低毛利(约30%)定制化项目占比高达77.5%,而高毛利标准化AI产品三年增收不足2000万元;客户极度集中,最大客户贡献超81%营收,回款周期拉长至225天;50亿元估值对应市销率近100倍,远高于成熟SaaS企业10–20倍的合理区间,属典型“雷军概念+AI情绪溢价”。综上,此次IPO核心目标是“解债”与“退出”,而非技术扩张——故事很AI,生意很传统,风险很真实。https://www.ofweek.com/ai/2026-06/ART-201718-12003-30692619.html
4-2. 世界模型公司「厘清智能」完成数亿元种子轮融资,顺为红杉高瓴齐押注
「厘清智能」是一家由清华97后博导李一鸣教授创立的具身智能初创公司,刚完成数亿元种子轮融资,获顺为、红杉中国、高瓴等顶级资本联合加持,其中顺为与红杉更连续多轮追投。公司聚焦“世界模型”这一核心——不是简单AI模型,而是融合视觉、空间与触觉的物理交互智能系统:它既是能预测推理的“大脑”,也是遵循真实物理规律的“模拟器”。
为突破单点技术瓶颈,团队坚持数据采集、模型架构、物理引擎全栈自研,构建“数据→模型→环境”自循环生态。目前团队仅50余人,平均年龄22岁,汇聚伯克利等顶尖高校人才,已产出CVPR/NeurIPS多项成果。其技术已验证可跨不同机械臂与灵巧手快速迁移,真正实现跨本体、跨场景、跨任务的泛化物理交互能力。https://m.pedaily.cn/news/565697
4-3. AI Agent评估公司Patronus AI融资5000万美元,营收一年增长15倍
Patronus AI 是一家成立于2023年的旧金山初创公司,由前Meta AI研究员联合创办,专注解决AI智能体“看似聪明、实则不可靠”的痛点。随着AI从回答问题迈向自主完成多步任务(如订机票、做财报),模型厂商亟需更真实的测试方式——而非仅靠传统基准测试。
Patronus创新性地构建“数字世界模型”,即高度仿真的网站和企业系统虚拟环境,让AI智能体在其中反复试错、接受强化学习训练。其技术能精准识别智能体“走捷径”等投机行为,类似Waymo用仿真测试自动驾驶。目前服务软件工程与金融领域,已获几乎所有头部AI实验室及新兴AI公司采用。过去一年营收暴增15倍,本周宣布完成5000万美元B轮融资,由Greenfield Partners领投。https://view.inews.qq.com/k/20260629A033ZN00

4-4. 「德塔智能」成立不到半年连获五轮融资,聚焦人形机器人基础模型
德塔智能是一家成立不到半年的“人形机器人基础模型”公司,已连续完成5轮融资,获元禾控股等超10家机构支持,是目前唯一同时获智元、乐聚、星海图三大头部本体厂商投资的具身智能企业。其核心目标很实在:让人形机器人从“会跳舞”真正迈向“能干活”。
当前双足机器人虽已实现奔跑、空翻等高难度动作,但在家庭和工厂中稳定执行整理、搬运、装配、巡检等真实任务仍面临巨大挑战。德塔聚焦“全身协同作业”(Loco-manipulation),构建覆盖3D空间理解、任务推理、全身控制与力位混合交互的闭环模型。已自研3D世界引擎、全身数据采集系统,并在一汽红旗产线、南方电网变电站、SMT分拣等场景完成验证,任务成功率与连续作业能力显著提升。https://www.163.com/dy/article/L0IVC8BE0511DPVD.html
AI风险与政策管理
5-1. AGI倒计时,OpenAI首席研究官重磅表态:留给人类的窗口「很小」
OpenAI首席研究官Mark Chen近日释放出强烈信号:AGI(通用人工智能)正加速逼近。他强调,Scaling Laws(规模定律)远未失效——更大模型、更优数据、更强推理与长程任务能力,仍是通往AGI的核心路径。过去10年,OpenAI已推动性能跨越近10个数量级;o1模型的成功,正是“预训练+推理增强”范式突破的实证。
如今,AI已在数学、编程等领域频频打出人类想不到的“神之一手”,并开始胜任数周级真实科研任务。未来研究员将转向“Vibe Researcher”——重在提出问题、判断方向与品味(taste),执行全由AI完成。但挑战严峻:评测体系濒临崩溃,且AI能力呈现“参差前沿”——能解奥赛题却不会系鞋带,根源在于持续学习与上下文迁移仍未攻克。https://www.163.com/dy/article/L0M43NF40511ABV6.html


写在最后
欢迎大家关注、分享、转发本公众号,也欢迎直接与小编联系 对接合作~
小问卷:公众号打分点评
