人类首次,将完整物种基因,「塞进量子计算机」

最近,牛津大学和世界领先的英国威康桑格研究所(Wellcome Sanger Institute)的科学家们干成了一件听起来非常不可思议的事:他们把人类已知基因组最小的病毒——丁型肝炎病毒(HDV)的完整基因信息,硬生生“塞”进了一台IBM的量子计算机里。
在此之前,没人把一个完整物种的基因组放进过这种以“不讲武德”著称的超前计算设备中。
虽然它现在还没立刻吐出什么震惊世界的分析结果,但老实说,在量子计算的语境里,“把数据成功输进去”本身,就已经是一场值得开香槟的硬仗了。

图|威康桑格研究所发布消息(来源:威康桑格研究所)
01. 从单行道到变态地铁图
为什么非得动用量子计算机?因为传统的超级计算机,哪怕算力再逆天,在面对人类未来的基因野心时,也快要吃不消了。
自从2003年人类基因组计划完成以来,我们一直把基因组看作是一条线性的序列。但问题是,人跟人是不一样的。只用几个人的基因来代表全人类,会产生巨大的“参考偏差”。
于是,科学家们搞出了一个新概念——“泛基因组”(Pangenome)。
如果说传统的参考基因组是一条笔直的单行道,那泛基因组就是一张极其复杂的城市地铁网。主干线是全人类共有的基因,而那些弯弯绕绕的支线、环线,则代表着不同人群的基因变异。
牛津大学计算机科学系副教授 Sergii Strelchuk 吐槽说,把个人基因数据跟这种图谱进行比对,简直就像在看一张异常复杂的日本地铁图,又或者是一团“乱麻”。
当我们要分析几百甚至上千人的基因网络时,传统计算机的二进制逻辑(不是0就是1)就被庞大的计算量按在地上摩擦了。
而在理论上,量子计算机的“量子比特”(Qubit)因为可以同时处于0和1的叠加态,天生就适合处理这种包含无数条可能路径的迷宫问题。
有一个很狂的理论数据是这样的:人类单倍体基因组有32亿个碱基对,如果用传统计算机存储,大约需要64亿个经典比特;但如果量子计算机完全理想化,理论上只需要区区33个量子比特就能搞定。

图|人类泛基因组(来源:humanpangenome)
02. 理想很丰满,现实很骨感
但现实情况远比理论骨感得多。把基因插进量子计算机,绝对不是插个U盘、“Ctrl C+Ctrl V”那么简单。
实际上,如何把庞大的生物信息压缩并编码成量子态,难度丝毫不亚于计算本身。
研究团队原本雄心勃勃,想拿1977年第一个被完整测序的生物——ΦX174噬菌体来练手。但一盘算,ΦX174有5386个碱基,需要387个量子比特来编码。
尴尬的是,他们手里那台IBM最新的Heron处理器,只有156个量子比特。没办法,算力余额不足,只能“降级”消费。
他们最终选中了导致严重肝病的丁型肝炎病毒(HDV),因为它只有约1700个碱基,是已知人类病毒中最小的,最终刚好占用了117个量子比特。
这就像是用最前沿的宇宙飞船,运送了一颗非常小的土豆。
但正如Wellcome Leap项目总监 Shihan Sajeed 所说,上世纪70年代 Fred Sanger 测序出第一个完整DNA基因组,是经典基因组学的“Hello World”;而今天,用量子态编码并装载完整基因组,就是量子基因组学的新“Hello World”。

图|IBM 156 Q 量子计算处理器(来源:IBM)
03. 一场5000万美元的饥饿游戏
这项硬核突破的背后,其实是一场非常有戏剧性的资本与技术角逐。
它属于一个叫“Quantum for Bio(Q4Bio)”的国际研究挑战赛,由英国Wellcome Trust剥离出来的高风险医学基金Wellcome Leap狂砸5000万美元(约合4000万美元研发资金加1000万美元奖金)设立。
项目最初有80多个团队报名,12个团队入围,大家各自立下军令状,最后只剩6个团队杀入决赛圈。
参与其中的研究人员形容这简直是一场“饥饿游戏”版的淘汰赛。团队必须像运作初创公司一样,不断试错、失败、然后迅速爬起来调整。
他们目前盯紧的是一笔200万美元的奖金——要求是在50个以上的量子比特上执行有生物学意义的任务,并且证明有扩大规模的潜力。
至于那笔500万美元的终极最高奖?Strelchuk 自己都表现得相当接地气,他直言这个要求太高了,现有的任何量子计算机都做不到,“如果有人能拿到这500万,我会非常惊讶。”

图|Wellcome Leap 的 Quantum for Bio 挑战计划(来源:Wellcome Leap)
04. 大门已经被撬开
报道科技突破最忌讳画大饼,虽然这波操作很秀,但在短时间内,量子基因组学还打不过现有的经典计算机算法。
今天的量子计算机依然不稳定、容易出错,且量子比特数量有限。意大利国际高等研究院的量子算法研究员 Guglielmo Mazzola 就很客观地泼了点冷水:“在量子计算机能够处理更大的基因组或真正执行分析之前,很难判断它们是否会超越其他最先进的技术。”
但这正是技术演进的必经之路。从长远来看,如果能够真正释放量子计算的潜力,我们将不仅能更迅速地追踪传染病、理解罕见遗传病,甚至能去解开像“染色体碎裂”(一种极其复杂的癌症机制)这种传统计算机根本无从下手的究极生命谜题。
大门已经被撬开了一条缝。正如 Strelchuk 调侃的那样:“传统的工具已经被这些日益复杂的基因数据搞得寸步难行了,既然我们有可能更快地得到更好的答案,为什么不借这个机会搞点酷的事情呢?”
引用:
[1]https://www.science.org/content/article/first-complete-genome-loaded-quantum-computer
[2]https://www.sanger.ac.uk/news_item/genome-loaded-onto-a-quantum-computer-in-world-first/
[3]https://wellcomeleap.org/q4bio/program/
[4]https://humanpangenome.org/
[5]https://www.dongascience.com/en/news/77420
[6]https://www.iflscience.com/you-have-to-iterate-you-have-to-fail-you-have-to-quickly-pick-yourself-up-genome-loaded-onto-quantum-computer-for-first-time-83169
[7]https://www.facebook.com/sangerinstitute/posts/scientists-have-successfully-loaded-a-complete-viral-genome-onto-a-quantum-compu/1377283874420303/

联系与爆料: Qtumist_info@163.com

延 伸 阅 读
