DNA存儲,從“雕版印刷”走向“活字印刷”(嘮“科”)

海量數據是構建人工智能大模型的基礎,目前全球數據量呈指數級增長。硬盤、磁帶、U盤等硅基存儲介質,存在壽命短、能耗高、佔用空間大等問題,無法滿足日益增長的數據存儲需求。怎麼辦?這就要發展新型數據存儲技術。
DNA是天然的數據信息編碼存儲材料。它的密度高,是現有存儲介質的107倍﹔壽命長,低溫下可穩定保存數千萬年﹔能耗低,是解決大數據存儲困境的“優解”。
目前,絕大多數DNA存儲技術採用類似“雕版印刷”的設計策略,主要思路是“讀”(直接測序)和“寫”(依序合成)。具體而言,是根據一定的編碼映射原則,將0—1二進制計算機數據文件編碼轉換為A—T—C—G四進制DNA編碼,並進一步合成寫入DNA,進行存儲﹔當需要時,這些存儲數據的DNA“文件夾”可以利用高通量測序等手段解碼。不過,如同“雕版印刷”的使用,這種DNA存儲是一次性的,使用一次、合成一次,成本高、時間長。
受我國古代“活字印刷術”啟發,科研人員提出“DNA活字存儲”設計思路。“DNA活字”由預制的DNA片段構成,可編碼1字節的信息。根據需要打印的文件內容,我們可以自由調用“DNA活字”,按需組合,再通過一步多級連接形成“DNA活字塊”,最終構成完整的DNA存儲文件。
打印過程如何實現呢?科研人員開發了“DNA活字”噴墨打印及印刷一體機“畢昇一號”,實現“DNA活字”存儲流程的自動化。“畢昇一號”裝配了數百個預制的“DNA活字”溶液,可根據排版打印的文件需求,按照電腦程序指令自動選擇所需的“活字”,並全自動組裝連接成“DNA活字塊”。
“DNA活字存儲”擁有類似於活字印刷的復用性和靈活性,展現出明顯的成本和效率優勢。科研人員測算,“畢昇一號”裝配的一個“DNA活字”可打印1萬次,存儲成本大幅降低。借助古人的智慧和現代科研人員的努力,“DNA活字存儲”也將為大數據時代的海量存儲需求提供一種新的解決思路。
(作者為中國科學院北京基因組研究所(國家生物信息中心)研究員)
《 人民日報 》( 2025年06月07日 06 版)

分享讓更多人看到
- 評論
- 關注