这家国产GPU厂商，再获超10亿元融资！

发布时间：2026-04-20来源：芯智讯

4月20日，国内全栈自研 AI 推理 GPU 企业——杭州曦望芯科智能科技有限公司（简称“曦望”）通过官方微信公众号宣布，已经完成新一轮超10亿元人民币融资。

而在去年7月初，曦望才刚完成近10亿元融资。当时这轮融资由三一集团旗下华胥基金、第四范式、游族网络、北京利尔、松禾资本、海通开元等多家机构共同参与。

没想到，时隔仅10个月不到，曦望又完成了新一轮超10亿元的融资。

至此，分拆独立仅一年多的曦望已累计完成七轮融资，总融资额约 40 亿元，成为国内首家估值超百亿的纯推理 GPU 独角兽。

据介绍，本轮融资资金将主要用于新一代启望 S3 推理 GPU 的规模化量产交付、全栈软件生态建设，以及 S4/S5 后续芯片的研发迭代。

曦望在官方新闻稿中指出，2026 年被行业公认为“AI 智能体元年”。随着大模型从“会聊天”进化为“会思考、会执行”的数字员工，推理需求迎来爆发式增长。英伟达 GTC 2026 大会正式宣告 AI 产业全面迈入“推理落地、智能体普及”的新时代，将“每瓦 Token 吞吐量”定义为 AI 时代的核心竞争力。这与曦望自创立之初就锁定的核心战场高度契合。

“AI 算力基建的重心已彻底切换。”曦望董事长徐冰表示，“2026 年 AI 推理计算需求将达到训练需求的 4-5 倍，推理算力租赁价格半年涨幅近 40%。”

资料显示，曦望前身是商汤大芯片部门，2024年底分拆独立运营，专注于高性能GPU及多模态场景AI推理芯片的研发与商业化。公司研发团队凭借8年技术沉淀、20亿研发投入及两代量产芯片的工程化验证，已成为国产GPU替代的核心力量。公司致力于为千行百业提供成本降低10倍、能效比突破的智能算力基石，通过技术创新和深度产业协同，推动各行业的智能化发展，并助力实现通用人工智能（AGI）的普惠化目标。

目前，曦望团队规模已增长至 400 人，研发人员占比超 80%，汇聚了来自英伟达、AMD、华为海思等国内外顶尖芯片企业的核心人才，硕士及以上学历占比超 80%。团队融合了芯片设计、高性能计算、AI 算法、软硬产品的跨行业人才。

在具体产品方面，曦望目前的产品线主要包括已经量产的曦望S1、S2和即将量产的S3。

△从左至右：曦望 S1、曦望 S2-M1模组、曦望 S2-X1加速卡

其中，S1是面向云端和边缘端视觉推理的专用芯片，主要用于视频分析模型推理，支撑CV类人工智能应用的计算需求，出货量已超过2万片；

S2是面向大模型推理的GPGPU产品，采用采用7nm工艺，兼容主流的英伟达CUDA生态，其性能水平可对标英伟达A100。S2的研发涵盖指令集、GPGPU IP架构、算子开发及编译器工具链等全部核心技术，实现完全自研。

曦望于2026年1月正式发布了新一代旗舰产品启望 S3 推理 GPU。这是国内首款搭载 LPDDR6 且兼容 LPDDR5X 内存的推理 GPU，它没有盲目照搬高端训练 GPU 的 HBM 显存路线，而是基于 Agent 推理的本质需求，从 AI Core 计算架构到内存 IO 系统进行了全链路重构。

据介绍，启望 S3 通过计算层的深度定制，解决了通用 GPU“算力用不满”的核心痛点，推理性能较上一代 S2 提升 5 倍，目标实现 Token 成本下降 90%。

具体来说，启望 S3 将GEMM 和 Flash Attention 两项核心算子（在大模型推理中，占总计算量的 90%以上）的利用率分别推至约 99%与 98%，标称算力几乎都转化为有效吞吐，同样硬件投入可服务更多并发请求。

启望 S3 采用 128-bit 指令集+支持 3D 指令，指令密度领先传统 SIMT 架构；独立线程调度精准匹配智能体复杂控制流，消除条件跳转带来的流水线代价；通过 Block cluster 和 Broadcast 等技术实现片上数据复用，减少对外带宽依赖，大幅提升 Agent 多轮推理效率。

启望 S3 还原生支持 FP16 至 FP4 全链路低精度运算，在 DeepSeek V3/R1 等主流模型上实现接近无损的 FP4 推理，吞吐量较 FP16 提升 3-4 倍，直接转化为客户侧的毛利空间和价格弹性。

在接口方面，启望 S3 创新性地集成了LPDDR6内存接口、高速 SerDes+SUE 融合互联技术、PCIe Gen6接口这三大先进高速接口技术，从内存和 IO 两个推理时代最核心的瓶颈入手，解决了智能体三大核心瓶颈。

从产业周期看，训练侧格局已相对固化，而推理侧正随 Agentic AI 放量进入指数级增长通道——多家机构预测，未来五年推理算力市场规模将超越训练侧数倍，其中 Agent 类负载将贡献最主要的增量。

曦望表示，启望 S3 同时具备三个难以共存的要素：推理原生的架构前瞻性；实现 98-99% 算子利用率的顶尖工程能力；完整的生态适配能力。

“启望 S3 不是简单的性能升级，而是一次对 AI 推理成本曲线的重构。”徐冰表示，“我们的目标是将推理成本降至‘百万 Token 一分钱’，让 AI 像水电一样成为普惠基础设施。”

在本轮融资的助力下，2026 年，曦望将围绕“落地、兑现、增长”核心原则，将全力推进启望 S3 芯片量产交付，完成与国内外主流大模型、多模态模型和Agent框架的全面适配。同时，公司已完成启望 S4 高性能推理 GPU 和启望 S5 安全可控推理 GPU 的技术路线规划，持续加码近存计算、光电共封等前沿技术探索。

编辑：芯智讯-浪客剑

往期精彩文章

三星工会警告：罢工18天，损失或达1389亿元！

“雷军被堵车里维权”？小米高管辟谣

腾讯贡献84%营收！燧原科技三年亏43亿，最快2026年盈利！

Meta开启裁员，首批8000人！

三星宣布LPDDR4/4X年底停产

紫光展锐即将完成IPO辅导验收，冲刺国产手机芯片第一股！

美国修订MATCH法案：保留DUV对华限制，但放宽了这些！

前苹果/高通/Nuvia芯片天团集结：从零开始重构通用CPU！

黄仁勋：限制中国AI是徒劳的，华为营收都新高了！

Q1净利大涨58%！台积电2nm已量产！魏哲家：不惧马斯克与Intel合作！

芯原股价闪崩，董事长辟谣

暴涨429%！深圳龙岗大普微上市，市值破1000亿！

钨价暴涨6倍！中国管制之下，多家日企“断粮”

英伟达用AI设计芯片：一夜干完8个人10个月的工作！

出货量全球第一！曦智科技赴港IPO：冲刺光算力芯片第一股！

力箭一号发射成功，奇点图谱搭载算力产品成功入轨

慧荣科技总经理：明年NAND缺货更严重，正全力避免断链！

中国出台新规，反制外国“长臂管辖”

比亚迪回应火灾事故：无人员伤亡！

行业交流、合作请加微信：icsmart01
芯智讯官方交流群：221807116

转载说明：本文系转载内容，版权归原作者及原出处所有。转载目的在于传递更多行业信息，文章观点仅代表原作者本人，与本平台立场无关。若涉及作品版权问题，请原作者或相关权利人及时与本平台联系，我们将在第一时间核实后移除相关内容。