我滴生活日记

您现在的位置是:首页 > 美文摘抄 > 正文

美文摘抄

中国科学家创新DNADNA存储技术算法,使敦煌壁画又“活”了两万年

admin2022-10-10美文摘抄756
科幻电影《侏罗纪公园》讲述了科学家发现史前蚊子的琥珀,从蚊子的血中获得恐龙的基因,使灭绝了6000万多年的恐龙复活的故事。被保存在DNA中,几年后被提取并恢复。这听起来有道理,但呼吸着一点冷空气。最

科幻电影《侏罗纪公园》讲述了科学家发现史前蚊子的琥珀,从蚊子的血中获得恐龙的基因,使灭绝了6000万多年的恐龙复活的故事。

被保存在DNA中,几年后被提取并恢复。 这听起来有道理,但呼吸着一点冷空气。

最近,天津大学的研究成果让人们接近了想象。 该校合成生物学团队通过将10幅精品敦煌壁画保存在DNA中、加速老化等实验,发现这些壁画信息在常温下可以保存一千年,在9.4℃下可以保存2万年。

DNA存储的敦煌壁画。天津大学供图

DNA存储技术概念图。天津大学供图

基于德布莱英图理论设计的序列重建算法高效解决DNA断裂、降解问题。天津大学供图

“如果是合适的温度等条件,可以保存千万年。 ”中国科学院院士、天津大学副校长元英进说。

小DNA有惊人的存储容量

人类文明的发展史,也是部信息存储技术的发展史。

从结绳报道、仓颉造字到磁带、硬盘等现代磁光电存储技术,数据存储有助于延续人类思想,记录灿烂文明。 造纸和印刷术的发明,使人类能保存的数据量在几百年内提高了约5个数量级。 进入计算机时代,人类产生的数据呈爆炸式增长。

“尽管全球各地都在建设数据中心,但数据中心的能耗却令人惊叹。 ”元英进说。 人们正在继续寻找更大量、更稳定、更安全的存储方式。

自然之斧神工的美妙之处在于,这——最好的内存可能藏在生命体里。

自从地球上出现生命以来,大自然一直用DNA保存信息。 到现在已经30多亿年了。 人类的五官在脸上是如何排列的,体内的蛋白质是如何合成的,眼睛是什么颜色的……这些庞杂的人类基因组信息被记录在比细胞小得多的DNA里,一代一代地传承着。

与各种人工记忆装置不同,DNA非常精密耐用,能够保存数亿年来无数生物的遗传信息,创造出生命的繁殖、进化和生物多样性。

那么,像把庞大的信息保存在u盘和硬盘上一样,“写入”小DNA的情况不是一举多得吗? 事实上,在人类发现DNA双螺旋结构后,美俄科学家相继提出用DNA存储数字信息的概念。

元英进解释说,DNA记忆与磁、光、电等普通信息存储介质相比有三个最明显的优势。 其最大的好处是存储密度高。 目前,天津大学的研究小组将部点经典视频剪辑存储在DNA上,实现了体积存储密度比普通硬盘高6个数量级。

同时,保存的信息的可用时间非常长。 此次研究人员将敦煌壁画10条信息保存在DNA中,结合创新算法,实现了DNA分子室温保存一千多年,9.4℃条件下保存2万年。这种长期保存所需的能耗很低。 元英进认为,DNA存储被认为是一种极具潜力的存储技术,是应对数据存储增长挑战的新机遇。

壁画“变身”为DNA需要几步

DNA信息存储原理共分为两个阶段——信息写入和信息读取。

这个过程实际上跨越了极其难以逾越的鸿沟。 它打破了有机和无机的界限,连接着生命和信息两大系统。

DNA是脱氧核糖核酸的缩写,包含“a”“t”“c”“g”4种碱基。 如果用数字中的0、1、2、3分别表示1个碱基,就会变成与计算机采用的0和1的二进制代码相似的四进制存储方式。

通过代码转换,“碱基四进制”和“计算机二进制”可以实现“对话”。 天津大学合成生物学前沿科学中心博士生韩明哲表示,壁画中的数字图像本质上是二进制位串。 “我们通过编码将这些二进制位串转换成四进制的ATGC碱基序列,再利用DNA合成技术将碱基序列写入DNA后,壁画上的数据图像就会‘转换’成DNA。 ”

到目前为止,该团队已成功地在酿酒酵母中合成了多余的人工染色体,上面保存了两张照片和一张视频信息,这被称为酵母CD。 随着酵母增殖扩增的进行,数字信息也被廉价且稳定地复制。

“我们即使将酵母传代培养到100代,也能够完美地恢复原始数据。 ”元英进说,如果脑洞再大一点,就可以把信息存储在一棵树里,随着树生长千百年,人类的后代随时可以从这棵树上读取千百年前保存的信息。

这次,这个年轻团队的创新之处在于能够在更差的条件下可靠地读取信息。 韩明哲说,保存有壁画信息的DNA本质上与天然DNA没有区别。 同样,还存在长时间储存造成的破坏和分解等问题,影响了信息存储的长期可靠性,这也成为亟待解决的重要科学问题。

因此,他们设计了基于基因图谱理论的序列重建算法,解决了DNA断裂等问题,可以从严重分解的DNA样本中恢复原始信息。

为了验证数据的长期可靠性,团队制作了无特殊保护的DNA水溶液样品,然后在70(℃)的温度下加速样品的断裂、降解至10周。 韩明哲说:“在这个过程中,80%以上的DNA片段发生了破坏错误,模拟了DNA在自然环境下千年万年的分解情况。”

然后,团队基于设计的序列重构算法,仍然能够正确组装和解码96.4%以上的片段,进而通过一种编码方式解决少量片段的丢失问题,完美地恢复原始敦煌壁画的照片。DNA储存距离实用化还有多远

虽然DNA储存还不普遍为人所知,但他表示“离实用化还很远”,正在努力走出实验室。 元英进表示,惊人的数据存储需求是新技术进入市场的最大推动力。

据国际数据公司估计,2025年全球年数据总量将达到175zb(1zb为10万亿字节)。 到2024年,全球将有30%的数字业务进行DNA存储试验。 但目前,DNA存储还想大规模应用,特别是在中国的实际应用还需要突破一些重要瓶颈。

小组分析了当前DNA信息存储面临的主要挑战。 信息存储成本高、信息读写速度慢、无法有效对接现有信息系统是三个主要限制因素。

据测算,当前的DNA存储器写入成本相当于20世纪80年代内存的存储成本,需要降低7-8个数量级才能达到当前的数据存储成本。

“DNA信息存储的成本将来可能会大幅下降。 ”韩明哲认为,今后可以从优化合成反应、改进芯片结构、更换廉价耗材、优化试剂分配量等方面着手,大幅降低合成成本。

同时,由于信息存储领域市场规模巨大,随着半导体器件、微纳加工在DNA信息存储领域的应用,该领域的巨大投资将对DNA合成技术产生重大影响,DNA合成技术和装备将迅速迭代升级,成本也有望快速下降。

DNA信息存储器的读取依赖于测序技术,与磁、光、电等存储器相比,读取速度慢。 现在,DNA测序仪的读取速度与硬盘相比,有3-4位数的差距——现有的电、磁存储技术通常每秒可以读取几十到几百兆字节的数据。 另外,DNA存储标准尚未建立,面临着与现有数字存储系统的兼容性问题。

“DNA信息存储是一个新兴的、多学科深度交叉融合的研究方向。 ”元英进认为,DNA存储将来很可能成为海量冷数据存储的主要存储介质。

冷数据就像档案馆的历史资料一样,需要保存海量的信息,但平时很少使用。 这些数据需要长期存储,功耗大,电子存储器的寿命往往为10年到几十年,需要反复更新,因此很难满足冷数据存储的需要。

DNA储存的实用化仍然面临着许多挑战。 元英进认为,目前的突破可能只是冰山一角,“技术进步需要10年磨剑的耐心,需要一点运气”。


发表评论

评论列表

  • 这篇文章还没有收到评论,赶紧来抢沙发吧~