量子计算，底层全靠英伟达们

发布时间：2026-06-30来源：光子盒

量子计算机承诺有一天可以解决最强大超级计算机无法解决的问题。但人们低估了，仅仅运行这些机器需要多大的经典计算能力。

随着量子比特数的增加，如果要实现上述承诺，这一支持基础设施的创新将至关重要。

谷歌量子人工智能软件工程师Adam Zalcman解释说：“执行大多数计算最便宜、最快的方式是在经典计算机上运行它们，即使有量子计算机。”

这也意味着，量子硬件往前走一步，背后就需要更庞大的经典算力。校准、纠错、控制、调度，这些决定量子计算机是否能稳定跑起来的关键环节，几乎全是经典计算在干。

经典在量子中的作用

经典芯片的工程成熟度会使人产生这样的错觉：机器一推出来就可以十分稳定地运行计算。智能手机、服务器、GPU集群，每秒完成数以万亿计的操作，对于用户来讲简直就是理所当然。但是量子比特根本不是这样的。

超导量子比特、离子阱、中性原子、硅自旋或光量子路线，量子比特都是很敏感，温度、磁场、控制脉冲、邻近量子比特串扰、材料缺陷、读出噪声等都会影响它。

除了“量子态脆弱”之外，量子计算还需要定期校准和复杂的纠错方案来保证其正常运行。

校准和纠错本质上是经典问题，并不是量子问题，需要专用的经典硬件解决。

随着量子计算机规模的扩大，这些资源的规模也必须同步增大。这意味着在可预见的未来，量子计算机也将变成混合设备，同时辅以大量经典计算。

量子硬件的调优

为了让一台量子计算机开工，第一步不是写量子线路，而是调试硬件让它们处于可用的状态。

这叫校准，即确定每个量子比特的共振频率、退相干时间、对控制脉冲的响应强度、与相邻量子比特间的耦合强度等。这些物理参数决定了这台机器会不会在执行完一条线路之前就坍塌。

以前这套工作要靠人做。Q-CTRL基础产品经理Jay Guilmart提到过这样一种场景：手工校准可能需要一个博士学位级别的研究人员花几天甚至是几周的时间才能够完成。

这并不是危言耸听。超导量子比特对于温度、电磁干扰、振动极为敏感，每次调谐都要牵一发而动全身，前一步的结果会左右下一步的判断，完全没有可套用的固定脚本。

可见，这不是一个可扩展的解决方案，所以自动化流程的趋势日益增长。

更麻烦的是，校准的不是一次性的工作。量子比特的重关键参数会随时间漂移，温度变化、设备老化等，都会使性能开始下降。

所以系统要不断做“运行时重新校准”。但校准本身就要占用量子处理器的执行时间——“如果我在做重新校准，那我就没在跑电路”，Q-CTRL首席产品经理Jay Guilmart这句话点出一个尴尬的权衡点：校准频率越高，系统的状态就越好，但真正用来计算的时间就越少。

为此，Q-CTRL等公司正在摒弃刻板的脚本路线，构建基于反馈回路的智能校准程序。

这类似于给量子系统加装一个高级的“全自动状态机”。当某一步测量结果出现异常时，软件不再是报错宕机，而是自动诊断问题来自于哪里，决定是小幅调一下脉冲参数、改回上一步重新做测量，还是启动全面重新校准。

实时解码错误

即使是校准正确的量子计算机也很容易出错，这也是企业大力投资量子纠错（QEC）的原因。

这通常涉及在大量物理量子比特共享状态下编码量子信息——即“逻辑量子比特”——以便在不破坏编码信息的情况下检测和补偿单个量子比特中的错误。

由于直接测量量子比特会导致量子态坍缩，因此错误检测是通过奇偶校验实现的，奇偶校验检测成对的量子比特是否共享同一状态。这会生成一系列称为“综合征”的测量结果，经典的解码器算法会分析这些综合征并定位错误。

这个过程一定要非常快。尽管大多数错误在操作以后可通过数学方式记录和纠正，但有些错误必须在算法继续执行之前立即修正。比如超导和硅自旋量子比特只能保持几微秒或几毫秒的量子态，错误必须在这个时间窗口内进行解码和纠正。

这就解释了为什么解码器几乎不能在通用的CPU上跑。

IBM量子超级计算首席技术官Jerry Chow坦言，这些严格的要求意味着解码器通常运行在专用硅芯片上，例如现场可编程门阵列（FPGA）或针对速度优化的专用集成电路（ASIC）。

他解释说：“你需要能够跑得足够快并能够有效地实时解码，而可利用的最佳方法就是通过高度集成的FPGA或ASIC解码器功能。”

Riverlane这方面走得应该是比较快的。2026年6月，Riverlane就和Rigetti等在Rigetti的Ankaa-2超导量子计算机上，使用FPGA完成完整的实时量子纠错解码，完整的解码响应时间小于9.6微秒，单次解码均值不到1微秒。

除此之外，Riverlane自己的Deltaflow 2系统在Google 2024年“Willow”实验的数据集上取得平均延迟16.32微秒的成绩，比Google原论文里面的63微秒快了将近4倍。

IBM当然也没有闲着，他们在Heron处理器上验证了能在微秒级完成错误综合征解码的FPGA固件，并用qLDPC码做到了实时错误解码，时间低于480纳秒。

一场关于“苦涩教训”的赌局

近两年，利用AI简化量子硬件控制的讨论也很热烈。

2026年4月，英伟达发布了两款用于校准和解码的AI模型。Ising Calibration是一个350亿参数的视觉语言模型，它能看懂校准测量出来的图形输出，配合AI代理自动调整处理器参数。

Ising Decoding是则是基于3D卷积神经网络，分为速度优化型和精度强化型两个变体。根据英伟达公布的数据，Ising Decoding比常用的pyMatching解码器快2.5倍、准确率高3倍。Ising Calibration能把原本需要数天的校准流程压缩到约5小时。

AI在解码中的吸引力在于，虽然模型训练耗时，但推理速度极快——而且由于跨多个芯片的并行处理，即使量子比特数量增加，这种速度也能保持。

然而也有玩家给“AI救市论”泼冷水。

Riverlane工程副总裁Marco Ghibaudi有一个很形象的比喻：“你可以有一根特别粗的管子，但它真的很长。”意思是把工作负载搬给GPU有算力暴增的效果，但数据的传送延迟也是致命的。

IBM的Chow也是比较谨慎的：GPU的延迟目前还不至于满足实时解码的要求，对于特性已经大致摸透的器件，简单的物理基本方法可能比AI更划算。

从长远来看，解码的“苦涩教训”终将到来。这个说法来自AI先驱Richard Sutton，指的是通用的学习方法随着时间推移总会胜过手工设计的算法。

意思是只要模型足够大、数据足够多，神经网络会最终比任何手写算法更好地捕捉这些隐藏的相关性。

但这“终将”不等于“现在”。神经网络解码器有三个问题：第一是延迟，已优化过的模型也很难压缩到微秒级；第二是可证明性，传统解码器有可证明性保证，而神经网络没有；第三是能耗和成本，大模型推理消耗的算力、电力在大范围部署时是不可忽略的负担。

所以更现实的路线其实不是“AI vs 传统”，而是“AI+传统”。谷歌正在规划研制的硬件架构同时集成传统解码器和基于AI的解码器，包括他们的AlphaQubit 2模型。

还没有赢家

无论什么方法最后得胜，有一点绝对是确定的，即未来的量子计算机需要大量经典计算的支持。无论你用什么技术，解码都是一个持续的、计算成本高的过程，所以你需要一块“健康”的经典硬件专门用于这项任务。

随着量子计算机设备规模增加到数千，数百万量子比特，校准计算开销也会“爆炸”。现有的方法很难实现规模化，因而需要新的方法。类似地，哪怕将来我们达到1000个量子比特时，也必须重新设计采取不同的做法。

所以今天，没有人赢得这场战斗。

参考链接

[1]https://spectrum.ieee.org/quantum-calibration-decoding

[2]https://news.qq.com/rain/a/20260602A093X800

[3]https://quantumzeitgeist.com/qec-latency-google-riverlane-cuts/