虚拟角色与人类对话的体验,正在被一项名为LPM 1.0的技术重新定义。这项由研究团队开发的大规模表演模型,首次将“说话”与“听话”能力整合进同一视频生成系统,让虚拟角色不仅能开口表达,还能通过点头、皱眉、眼神变化等细微反应,展现出对人类话语的真实理解。传统系统中角色仅能机械张合嘴部的局限,被这一创新彻底打破。研究团队指出,现有虚拟角色生成技术普遍陷入“表演三难困境”:追求动作自然则牺牲实时性,保证
在人工智能领域,让AI自主完成网页任务一直是备受关注的研究方向。从日常的表格填写、数据库查询到电商平台浏览,这些看似简单的操作却消耗着人们大量时间。因此,具备自主网页操作能力的“网页智能体”应运而生。然而,当前能有效处理复杂网页任务的AI大多依赖付费API,如GPT-4o、Claude 3.5 Sonnet等,不仅成本高昂,还需将用户数据传输至第三方服务器,难以满足企业和个人对数据隐私保护及成本控
美国东北大学与麻省理工学院联合团队在计算机视觉与多模态人工智能领域取得突破性进展,其研究成果已发布于预印本平台arXiv。该研究提出一种名为“神经拓扑”的新方法,通过构建视觉-语言模型(VLM)内部神经元协作关系网络,为理解AI如何融合图像与文本信息提供了全新视角。这项技术不仅能预测模型行为,还能精准识别AI“幻觉”现象,甚至通过干预关键神经元直接影响输出结果。传统研究多聚焦于单个神经元或注意力机
“AGI(通用人工智能)三年内必然到来,可多数企业领导者还在用‘自动化现有手动流程’这种陈旧思维应对,错失最后机遇。”屏幕那端,Danilo McGarry语气平静,却如重锤敲击着当下商业世界的神经。Danilo McGarry履历非凡,管理过3500名“数字员工”,为花旗和联合健康创造了20亿美元可衡量的价值。作为实战派专家,他厌恶不切实际的幻想,对未来有着近乎严苛的坦诚。在他看来,当下商业世界
在当今数字化浪潮中,智慧园区综合管理系统正成为提升园区运营效率与安全性的关键工具。通过整合物联网、大数据分析和人工智能等前沿技术,这类系统实现了资源的高效配置与动态管理,为园区内企业创造了更安全、便捷的运营环境。以某大型产业园区为例,其引入的智能管理系统通过实时监测水电使用情况,成功将能源浪费率降低了15%,同时通过电子合同系统将租赁签约周期从平均7天缩短至2天。安全防护体系是智慧园区建设的重中之
科技媒体近日披露,壹号本旗下新一代掌机OneXPlayer X2 Mini即将开启全球销售,这款产品以AMD“Strix Halo”平台为核心,直接对标联想即将推出的Legion Go 2。据内部人士透露,该设备在硬件配置与形态设计上均实现突破性创新,有望在便携式游戏设备市场引发新一轮竞争。硬件配置方面,OneXPlayer X2 Mini搭载锐龙AI Max+ 395处理器,性能表现与GPD W
新加坡国立大学与牛津大学联合研发的AI游戏测试平台GameWorld,通过34款浏览器游戏和170个任务构建起一套全新的评估体系。这项研究以技术报告形式提交至arXiv平台,编号为arXiv:2604.07429,为多模态大语言模型的能力边界提供了量化依据。与传统测试依赖问答模式不同,该平台将AI置于动态游戏场景中,要求其完成从画面解析到动作执行的全流程操作,成绩完全基于游戏内部数据自动生成。研究
全球半导体行业正迎来新一轮价格调整浪潮,继台积电等头部企业之后,联电(UMC)近日宣布将上调晶圆代工价格。这一决策源于多重成本压力与持续旺盛的市场需求,标志着涨价趋势已从先进制程向成熟制程领域全面扩散。根据联电向客户发布的正式通知,价格调整将于2026年下半年启动。公司在说明中指出,原材料、能源、物流等运营成本持续攀升,叠加关键制造设备采购开支激增,是推动此次调价的核心因素。同时,联电强调此举旨在
在智能化浪潮席卷全球的背景下,具身智能正从技术概念加速向产业应用转化。行业领军企业智元近日在合作伙伴大会上提出“一体三智”发展范式,并发布覆盖工业制造、商业服务、特种作业三大领域的七大生产力解决方案,标志着具身智能正式进入规模化部署阶段。据智元创始人邓泰华介绍,公司构建了具身智能产业演进的XYZ曲线模型:2022-2025年为开发尝鲜期,重点突破机器人运动能力;2026-2030年进入部署成长期,
近年来,中国新能源汽车在舒适性、智能化和科技感等领域实现了跨越式发展,取得了令全球瞩目的成绩。然而,当谈及高性能旗舰中大型SUV时,消费者脑海中浮现的往往是宝马M、奔驰AMG和保时捷等传统燃油时代的经典车型。高性能始终是全球超豪华汽车品牌的共同语言,体现了车企的造车底蕴、技术积累和品牌文化。随着新能源汽车时代的到来,中国汽车工业迫切需要一款能够代表全球顶尖水准的“性能图腾”。在这一背景下,极氪8X
具身智能作为人工智能领域的前沿方向,正站在商业化落地的关键节点,然而训练数据的规模化供给与流通难题,成为横亘在全行业面前的一道高门槛。这一痛点不仅制约着技术突破,更推动着产业格局的深刻调整,一场围绕数据的技术路线探索与生态布局竞赛已然拉开帷幕。当前,全球具身智能产业仍处于商业化前夜,多数机器人产品仅能完成实验室演示或限定环境下的预设动作,一旦进入真实场景,其泛化能力便急剧下降,难以解决实际问题。京
在人工智能视频生成领域,一项名为LiVER的创新研究框架正引发广泛关注。这项由多所高校及科研机构联合完成的研究,通过将物理渲染技术与AI视频生成深度融合,为解决传统工具中常见的光照不协调问题提供了全新思路。研究团队构建的LiVER框架,通过引入基于物理的渲染机制,使生成视频的光影效果首次达到专业影视制作水准。传统AI视频生成工具依赖海量数据训练,虽能模仿真实场景的视觉特征,却在处理光照效果时暴露明
小米创办人、董事长兼CEO雷军近日完成了一场备受瞩目的长途驾驶挑战。他驾驶小米SU7 Pro从北京出发,历经15小时的连续行驶,最终抵达上海,全程仅充电一次,成功验证了车辆的续航能力。此次挑战路线为北京至上海,雷军团队选择在满电状态下出发,途中仅进行一次充电。当晚20:30,车辆从S2沪芦高速康桥收费站顺利下高速,抵达上海时已累计行驶1265公里,ETC系统显示通行费为645元。为进一步测试续航极
在人工智能领域,关于大型语言模型训练方法的争议由来已久。传统观点认为,监督微调(SFT)只能让模型机械记忆训练数据,而强化学习(RL)才是实现真正泛化能力的关键。然而,上海人工智能实验室联合多所高校的研究团队通过系统性实验发现,这一结论可能过于片面——在特定条件下,SFT同样能让模型具备跨领域推理能力。研究团队通过对比不同训练时长、数据质量和模型规模的影响,发现SFT的效果呈现"先跌后升"的独特模
人工智能企业Anthropic宣布推出视觉设计工具Claude Design,将其核心技术从文本生成领域拓展至设计、原型制作及演示文稿等视觉创作场景。这一动作使该公司直接进入与Canva、Figma等成熟设计平台的竞争赛道,标志着其商业化战略进入新阶段。基于最新视觉模型Claude Opus 4.7构建的该工具,目前以研究预览版形式向订阅用户开放。首批获得访问权限的包括Claude Pro、Max
AI报告
电话咨询
在线咨询