细菌纳米孔开启数据存储的未来
2020 年,世界上每个人每秒产生约 1.7 兆字节的数据。仅在一年内,就达到了 418 ZB 或 4180 亿 1 TB 的硬盘驱动器。目前,我们将数据以 1 和 0 的形式存储在寿命有限的磁性或光学系统中。同时,数据中心消耗大量能源并产生巨大的碳足迹。简而言之,我们存储不断增长的数据量的方式是不可持续的。
DNA 作为数据存储
但还有另一种选择:将数据存储在DNA 等生物分子中。在自然界中,DNA 在微小空间(细胞、细菌、病毒)中编码、存储和制作可读的大量遗传信息,并且具有高度的安全性和可重复性。
与传统的数据存储设备相比,DNA 更持久、更紧凑,可以保留十倍的数据,存储密度提高 1000 倍,并且存储与驱动器相同数量的数据消耗的能量减少 1 亿倍。此外,基于 DNA 的数据存储设备非常小:仅 4 克 DNA 就可以存储一年的全球数据。
但是用 DNA 存储数据也涉及高昂的成本、令人痛苦的缓慢写入和读取机制,并且容易被误读。
纳米孔来拯救
一种方法是使用称为纳米孔的纳米级孔,细菌经常将其打入其他细胞以破坏它们。攻击细菌使用被称为“成孔毒素”的特殊蛋白质,这些蛋白质会附着在细胞膜上并通过它形成管状通道。
在生物工程中,纳米孔用于“感应”生物分子,例如 DNA 或 RNA。分子像一根绳子一样穿过纳米孔,受电压控制,它的不同成分产生不同的电信号(“离子签名”),可用于识别它们。由于其高精度,纳米孔也被用于读取 DNA 编码的信息。
尽管如此,纳米孔仍然受到低分辨率读数的限制——如果要使用纳米孔系统来存储和读取数据,这是一个真正的问题。
气溶素纳米孔
纳米孔的潜力激发了 EPFL 生命科学学院的科学家探索由嗜水气单胞菌制造的成孔毒素气溶素产生的纳米孔。在 EPFL 生命科学学院的 Matteo Dal Peraro 的带领下,研究人员表明气溶素纳米孔可用于解码二进制信息。
2019 年,Dal Peraro 的实验室表明,纳米孔可用于感测更复杂的分子,如蛋白质。在这项发表在《科学进展》上的研究中,该团队与 Alexandra Radenovic 实验室(EPFL 工程学院)合作,采用气溶素来检测定制的分子,以供该孔精确读取。该技术已申请专利。
这种被称为数字聚合物的分子是在斯特拉斯堡 CNRS 查尔斯·萨德隆研究所的 Jean-François Lutz 实验室开发的。它们是 DNA 核苷酸和非生物单体的组合,旨在通过气溶素纳米孔并发出可以作为数据位读出的电信号。
研究人员使用 aerolysin 突变体来系统地设计纳米孔,以读取其信息聚合物的信号。他们优化了聚合物通过纳米孔的速度,以便它可以发出唯一可识别的信号。“但与传统的纳米孔读数不同,这种信号以单比特分辨率提供数字读数,并且不会影响信息密度,”该论文的第一作者 Chan Cao 博士说。
为了解码读出信号,该团队使用了深度学习,这使他们能够以高精度解码来自聚合物的多达 4 位信息。他们还使用这种方法盲目识别聚合物混合物并确定它们的相对浓度。
该系统比使用 DNA 进行数据存储便宜得多,并提供更长的耐用性。此外,它是“可小型化的”,这意味着它可以很容易地集成到便携式数据存储设备中。
“我们正在努力将这个仿生平台转变为用于数据存储和检索的实际产品,”Matteo Dal Peraro 说。“但这项工作清楚地表明,生物纳米孔可以读取混合 DNA-聚合物分析物。我们很兴奋,因为这为基于聚合物的记忆开辟了新的有前景的前景,在超高密度、长期存储和设备便携性方面具有重要优势。”
标签: 细菌纳米孔