近日,由中科闻歌与中国科学院磐石(ScienceOne)团队联合技术攻关,面向科学领域的多模态大模型 S1-VL-32B开源并发布,在多项科学多模态评测中表现SOTA。S1-VL-32B支持两种推理模式:Multimodal Reasoning多模态推理模式即基于链式思维的多模态科学推理,适用于复杂、多步问题的分析与求解;Thinking with Images图像思考模式即模型可在推理过程中主动
【导读】Meta SOAR用「剧毒数据」当垫脚石,硬生生把模型从Fail@128的认知黑洞里拽出来,推理能力暴涨9.3%!2026年,这才是最硬核的反杀路线。如果给AI喂一份错误率高达67%的教材,结局会是什么?放在以前,他绝对会被喷成筛子:这叫「数据投毒」!轻则模型脑雾,重则逻辑崩塌,直接送进ICU。但在Meta FAIR的实验室里,这剂毒药,变成了救命的神药。论文链接:https://arxi
REPORT斯坦福 AI 指数报告(AI Index Report) 由斯坦福「以人为本人工智能研究院」(HAI)每年发布,追踪、整合并可视化 AI 领域的各类数据刚刚,「斯坦福 AI 指数报告 2026」发布,423 页,9 个章节与 2025 版相比,今年新增了两个独立章节:AI 与科学、AI 与医疗,同时新增了 AI 主权分析框架和生成式 AI 的消费者价值估算过去两年,我每年都会进行完整解
▎AI人才回流,但故事没那么简单。作者|硅谷Tech news编辑|秦聪慧本文首发于钛媒体APP一场悄然但加速的人才迁移正在重塑全球科技格局,越来越多高调的中国研究人员放弃硅谷,转而到北京、杭州等地任职。2025年2月,前Google Fellow、谷歌大脑及DeepMind研究副总裁吴永辉加入字节跳动,接管旗下大模型团队Seed的基础研发。不到一年后的2025年12月,从清华姚班到OpenAI的
整理 | 华卫 近日,刚带着对标顶级闭源模型的强悍性能登场不久的 MiniMax M2.7 模型,悄悄变更了开源使用条款。尽管先前将权重公开在 Hugging Face,但当下已然收紧授权:商业用途需获得 MiniMax 书面授权。非商业用途依旧免费且不受限制,科研、个人项目、自用微调等场景均不受影响;但若是搭建托管服务或开发商业产品,则必须申请授权。这一转变迅速引发社区热议,而 MiniMax
作者|董道力邮箱|dongdaoli@pingwest.com一张在 X 上疯传的截图,正让估值 66 亿美元的 Lovable 及其投资人们后背发凉。X 用户 @hysteresis_x 发布了一张尚未正式上线的 Claude 界面截图,配文:“带大家偷瞄一眼 Claude 马上要推出的新东西。”截图界面是不是很熟悉?不仅配备了提示词输入框、模板选项,甚至还包含了一个完整的项目管理面板。输入框中
事情是这样的。这几天我一直在用 gstack 跑 /office-hours,讨论 LobCard 的产品方向。gstack 是 YC 掌门人 Garry Tan 开源的 AI 开发工具,配合 Claude Code 一起用,GitHub 上已经 6.5 万颗星了。/office-hours 是里面一个模拟 YC 创始人访谈的技能,会逼你回答六个很难受的问题,用户是谁,真实需求是什么,有没有人愿意
# 背景介绍之前我们发布了AgentCLUE-Task测评基准方案,见:中文交互式Agentic任务测评基准方案发布!,一个中文、可验证、可扩展的对话式智能体评测基准。该基准旨在评测大语言模型驱动的Agent在双控制中文环境下的工具调用能力,基于τ² Bench的双控制核心技术,我们针对中文场景进行深度本土化适配,构建覆盖电信领域、外卖点单、电商零售、电子政务、购票服务5大领域的评测体系。在 5
夜间测试奔跑的机器人。图片经过AI处理文|苏扬编辑|徐青阳预计于4月19日在北京亦庄举办的“2026人形机器人半程马拉松”才刚测试就已刷屏,继春晚后再成焦点。除了那些“掉链子”“爆装备”的选手之外,快,可能是今年机器人马拉松会给大家带来的直观感受。 首次参加比赛的荣耀“闪电”机器人,在4月11日赛前的夜间测试因为速度飞快而引发关注。2026年夜间测试的机器人,速度有了大幅提升2025年5月份,荣耀
OpenAI CEO 奥尔特曼住所一周内两次遇袭,枪击案嫌疑人被捕4 月 13 日,OpenAI 首席执行官山姆·奥尔特曼位于旧金山的住所,在短短一周内接连遭遇两起袭击事件。继上周五发生燃烧瓶袭击后,当地时间周日凌晨,该住所再度遭枪击,目前警方已逮捕两名嫌疑人。据《旧金山标准报》报道,周日凌晨 1 点 40 分左右,一辆载有两人的本田轿车在驶过奥尔特曼住所后停在其门前。根据监控录像及安保人员证词,
未来我们到底需要什么样的家庭服务机器人,这家公司给了些许答案作者|李苏编辑|郑玄清晨七点三十分,当窗帘缝隙透进第一缕光线,一个温和的声音在卧室门口响起:「早安,今天北京有轻度雾霾,建议穿那件浅灰色风衣。早餐已经准备好了,咖啡在餐桌上,记得趁热喝。」这不是来自家庭服务员的声音,也并非科幻电影里的场景。这很有可能是一个普通家庭主人与 Futuring2 共处的日常。Futuring2,简称 F2,来自
多数 AI 创业公司卖的是一个更好的模型。CREAO AI 卖的是一个更好的循环。这家公司刚刚完成千万级美金融资,领投方为 Prosperity7 Ventures——阿美风险投资(Aramco Ventures)旗下的多元化风投基金和经纬创投,并获得过往投资人—包括云启资本、MONOLITH、高瓴创投、红杉中国、华业天成资本持续加注。在过去不到一年的时间内,CREAO AI已累积完成超3000万
当AI产品的全球化竞争正式进入后流量时代,单纯的获客增长已无法支撑企业的长期发展,如何精准定位产品,搭建可持续的增长闭环,实现从获客到留存、从转化到复购的全链路精细化运营,是所有AI出海创业者必须攻克的核心命题。2026年4月17日(周五),模速空间和入驻企业赤道象限EquatorQ共同举办「AI出海增长:转化与留存・精细化运营」主题论坛,以闭门深度交流的核心定位,聚焦AI产品全球化增长的本质问题
将 ScienceAI 设为星标第一时间掌握新鲜的 AI for Science 资讯作者 | 论文团队编辑丨ScienceAI从 AlphaFold2 到 AlphaFold3,结构预测模型解决了「算得准」的问题,Alphafold3 不仅能预测蛋白结构,还能准确建模蛋白质和药物配体相互作用。然而,在药物发现与计算化学的真实工作流里,科学家还要回答第二个同样关键的问题:分子如何运动 —— 配体在
在国内大模型落地市场上,云厂商一直是重要的力量。2026年第一季度,云厂商凭借在芯片、云平台、大模型、智能体开发平台、垂直场景深耕等多个层面的优势,成为了中标大模型项目的领导厂商。智能超参数以2026年第一季度的大模型中标数据为基准,来盘点一下,国内5家主要云厂商在大模型中标市场上的表现。各家云厂商整体表现2026年第一季度,智能超参数统计到1632个大模型中标项目,披露中标金额76.8亿元。5家
AI报告
电话咨询
在线咨询