大厂混战AI眼镜,Rokid获谷歌“官方认可”,交出标杆答卷


AI 眼镜的“Agent 时代”加速到来

文/VR陀螺
近日,Google Cloud Next 2026 上在拉斯维加斯成功举办。谷歌在大会上集中强调了从生成式 AI 向代理式 AI 的迁移,并把 Gemini Enterprise Agent Platform、Agentic Data Cloud、8 代 TPU 等能力作为核心看点。
为凸显 Gemini 在多终端适配与多模态交互上的落地潜力,谷歌在会场上展示了一款极具代表性的前沿硬件——由中国厂商乐奇 Rokid 打造的 AI 眼镜 Rokid Glasses(乐奇AI眼镜海外版)。
据悉,Rokid Glasses 是全球首款接入 Gemini 的 AI 眼镜。这款硬件并非简单的 AI 接口挂载,而是实现了 Gemini 与硬件生态的深度耦合。它将图像识别、音频交互与端云协同的能力高度集成于眼镜这一高频穿戴形态中,足以让谷歌把它当作一个能被展示、被验证、被传播的落地案例。

01
49g轻量化AI+AR眼镜,Gemini 落地终端的“最优解”
Rokid Glasses,普通 AI 眼镜的进阶版。
与市面上仅具备音频交互、拍照记录功能的轻量级 AI 眼镜不同,Rokid Glasses 是一款具备信息显示能力的 AI+AR 眼镜。其采用了“一拖二”的 Micro-LED+衍射光波导方案,支持最高 1500nits 亮度的单绿色信息显示,且整机重量仅为 49g。
这一显示能力对 Gemini 的落地至关重要。真正强大的多模态模型,不仅需要理解复杂的自然语言指令,还要能读懂视觉画面,并将计算结果直接反馈至用户的视野中。相比纯音频眼镜的语音输出,带有 AR 显示的硬件更贴近 AI 大模型理想的落地形态。毕竟,在人类的感官系统中,视觉是接收信息的第一渠道。

市场验证也是一层原因。去年,Rokid Glasses 登陆海外众筹平台 Kickstarter,最终筹资金额突破 400 万美元,一举刷新全球 AI/AR 眼镜品类的众筹纪录。今年,乐奇Rokid AI 眼镜正式登陆日本市场开售,销售额突破 4 亿日元,成为日本 Makuake 平台眼镜品类销售额最快破亿的硬件。
Omdia 报告显示,2025 年 AI 眼镜出货量达 870 万台,同比增长 322%。其中,在“带显示的 AI+AR 眼镜”分类中,乐奇 Rokid 市场占比达到第一。

这意味着谷歌选它,不只是选了一个能演示 Gemini 的外壳,而是选了一个已经在真实市场里跑通销售、产品和用户的载体。
此外,值得注意的是,谷歌与乐奇 Rokid 一直保持着较为密切的合作。在今年早些时候举办的 Rokid 生态大会暨 Spatial Joy 2025 全球 AR&AI 开发大赛上,谷歌云是其官方赛事合作伙伴;在面向海外用户的 Rokid Station2 上,Rokid 也与 Google 合作,将 Android TV 带上了智能眼镜这一新形态。
谷歌和 Rokid 核心逻辑在于对“生态能力”的实力互认。谷歌作为全球最大的开源生态缔造者之一,深知终端竞争的尽头必然是生态之战。而 Rokid 自成立以来,始终深耕 AR 与 AI 软硬件开放生态的建设,这种底层的“开放基因”与谷歌的战略诉求不谋而合。相比于许多刚跨界入局或试图建立封闭围墙的硬件厂商,Rokid 凭借多年积累,已经构筑了极具先发优势的开发者壁垒与平台包容性。这种生态聚合能力,正是谷歌在挑选大模型终端载体时最为看重的特质之一。
所以,从某种程度上来看,谷歌在本次大会上展示 Rokid Glasses 并非一次临时的拼盘,而是长期合作的必然结果。通过乐奇 Rokid 这个已经在全球市场跑通的硬件,谷歌试图向外界证明 Gemini 从云端模型到终端场景的落地能力,而 Rokid Glasses 正是这一标杆性产品。
02
AI 眼镜,典型的“代理式AI”硬件
硬件形态上的优势之外,Rokid Glasses 之所以能成为 Gemini 的产品案例,另一层核心原因在于,其产品演进路线与本次大会想要突出的代理式 AI 战略不谋而合。
Next’26 的关键词不是单纯的 AI,而是 Agent。谷歌在大会上把 Gemini Enterprise 描述为能构建、编排、治理和优化智能体的平台,并把 Agent Studio、Long-Running Agents、Memory Bank 等能力摆上台面。
这意味着 AI 的竞争重点,已经在从简单回答问题转向完成复杂任务。而眼镜这种设备,天然适合承接任务流的起点和终点。

Rokid Glasses 的产品逻辑正好贴近这个方向。语音唤醒之后,眼镜可以调用 AI 大模型理解需求,再去完成导航、拍摄、翻译、提醒等动作。整个过程就不再是简单的 AI 问答,而是“指令—执行—反馈”的闭环。
如一句“导航去乐奇 Rokid 公司”,AI 眼镜可能只要 5 秒左右就能给出完整路线。但是背后是一条极其复杂的 AI Agent 与硬件结合的技术路径——首先,通过 STT(语音转文本) 与大模型进行语义对齐,识别用户的导航意图;随后,AI 需要调用平台内的地图能力接口,抓取用户坐标,并结合“Rokid”等关键词完成目的地检索;最后,需要将适用于 AI 眼镜的导航画面显示到用户的 AI 眼镜上,并同步进行语音指引。

这也是为什么 AI 眼镜比手机更像 Agent 硬件的原因,手机适合输入和观看,眼镜更适合高效率把信息嵌入场景,减少切换成本。
据透露,乐奇 Rokid 与 Google Cloud 正展开全面合作,涵盖端侧与云端 AI 的深度协同。对于用户而言,最直观的体验跃升莫过于 Gemini Live 等功能的接入。基于 Rokid Glasses 特有的硬件形态,彻底释放了 Gemini Live 实时语音与视觉交互的真正潜力。
如果依托谷歌应用生态将此类能力向 AI 眼镜延伸,用户未来便能通过眼镜直接读取 Gmail、查看日程、调用 Drive 中的资料,甚至将拍摄的画面自动整理归档至云盘。这些场景并非天马行空的设想,而是 AI Agent 可以轻易做到基础能力,就看未来乐奇 Rokid 与 Google Cloud 的合作会到怎样的一个深度。

乐奇 Rokid 目前已经用硬件形态把多模态 AI 从抽象词汇变成了可以佩戴、可以工作、可以一起生活的一体化设备。换句话说,谷歌在大会上展示它,并不只是认可一款产品,而是在用它解释一个判断:AI 眼镜可能是 Agent 时代最自然的入口设备之一。
03
互联网大厂与手机巨头入局,AI眼镜的下一个赛点正在加速
AI 眼镜的市场竞争正在逐步升温。陀螺研究院预测,伴随着供应链技术的迭代,更多大玩家的入场,全球 AI 眼镜市场正在快速扩张,2026 年 AI 眼镜的出货量将达到 1900 万台。
从市场竞争维度看,科技大厂入局的优势显而易见:强大的 AI 底座、超级 APP 生态、品牌影响力以及现有的第一方硬件生态等。但大厂也面临着“生态越强,边界越窄”的围墙花园困境。相比之下,乐奇 Rokid 等独立 AI 眼镜品牌的竞争力在于不通过单一平台绑定用户,而是以更开放的姿态,尽可能将多元化的功能集成于单一设备,将选择权交还给用户。
比如,其 AI 大模型框架面向海外开放了 ChatGPT 5、Gemini 、DeepSeek和 Qwen,而国内用户也有豆包、DeepSeek、智谱清言、千问等选择。不同 AI 大模型的回答方式、口吻和工具调用能力各有不同,用户可以按需自由切换选用。

乐奇 Rokid 的开放不止于模型选择。今年二月,乐奇 Rokid 灵珠平台正式上线“自定义智能体”功能,允许开发者和极客用户通过标准的 SSE(Server-Sent Events)接口,将 Rokid Glasses 接入自定义后端,例如 OpenClaw 开源框架,以及用户私有部署的 DeepSeek R1、Qwen3、Kimi K2.5 等主流大模型。
通过此次谷歌大会释放的市场信号不难看出,中国 AI 眼镜厂商早已跨越了单纯的“硬件制造”阶段,具备了构建一整套软硬协同、真正可落地的 AI Agent 系统工程能力,并成功打造出可供 Gemini 验证的代表性标杆硬件。
值得一提的是,业界有传闻称乐奇 Rokid 或将于今年底推出全彩显示方向迭代的新款眼镜。如果消息属实,接下来,乐奇 Rokid 很可能继续把“Gemini 标杆硬件”这张牌打得更实。

陀螺研究院热门报告

《2025全球VR/AR年度产业发展报告》
《2026年3月VR/AR行业月报》
《2025年度XR大空间产业报告》
《2025全球VR/AR行业投融资报告》
《2025年AI+AR眼镜产业报告》
《AI+XR市场国际买家调查报告——渠道篇》
《Rokid Glasses硬件拆解与供应链分析》
《Micro-LED微显示产业发展报告》
《Apple Vision Pro核心技术拆解与供应链剖析报告》
《2024年度全球VR游戏产业报告》
《2024中国XR开发者调查报告》
推荐阅读



