大數據時代,我們在網絡上每一個動作,比如網上沖浪、觀看視頻,甚至跑步、走路等日常行為,每分每秒都在產生大量數據。它們如一條條河流,匯聚成數據的汪洋大海。
如此大量的信息如何存儲?珍貴的數字記憶要如何長久可靠地保存?科學家們想到了一種方法,將數據寫入活細菌的DNA中!
最近,美國哥倫比亞大學的研究人員通過改變環境電壓,引導“基因魔剪” CRISPR-Cas系統,將“hello world”翻譯成堿基語言,錄入大腸桿菌的DNA中。在繁衍80代以后,這些大腸桿菌體內儲存的數據仍然基本完好無損。
相關研究發表在1月11日的《自然·化學生物學》雜志。
數據時代,存儲的革新
在地球生命系統中,DNA 可謂無處不在。自然將生命的遺傳信息存儲在 DNA 中,人類也可以將數據信息存儲其中。
計算機的二進制語言只需要0和1兩個符號,即可編碼所有信息。生命的本質也是一種語言,那就是由 A、T、C、G 四種堿基串聯而成的 DNA ,四種堿基的順序蘊藏著生命的信息。
早在上世紀80年代末,就有人提出,或許可以將計算機的二進制數字語言轉換成DNA的四種堿基語言,從而將數據信息存儲在DNA上。讀取時只要反向進行DNA測序即可。
數據信息可以存儲在DNA中,也可以反過來從DNA中讀取數據信息。|來自網絡數據信息可以存儲在DNA中,也可以反過來從DNA中讀取數據信息。|來自網絡
相比于人類津津樂道的硅,DNA 簡直是數據存儲的理想載體。首先,DNA 的存儲密度非常大。如果我們能夠像大腸桿菌那樣包裝DNA,那么全世界的數據信息都可以儲存在1公斤重、只占粉筆盒大小空間的一堆 DNA 中。
其次,一般物理存儲設備使用壽命往往不到10年,DNA 則可將遺傳信息完整保存100年以上;如果是在零下18℃以下的低溫環境中,甚至可保存上萬年、數十萬年。
第三,DNA 存儲過程耗能極少。要存儲同樣大小的信息,DNA 的耗能量只相當于閃盤的億分之一。
人工合成 DNA 帶來希望
在實際操作中,二進制數字語言要如何轉換成DNA的四種堿基語言呢?2012年,哈佛大學遺傳學家喬治·丘奇團隊確立的規則是,用堿基A、C編碼二進制的0,G、T編碼二進制的1。
經過簡單翻譯,一本包含大約5.34萬個單詞的書籍、11張JPG圖片、一段簡短的計算機程序,全部被編碼進不到億萬分之一克的DNA微芯片中。這些文件大小相當于659千字節。之后,研究人員利用 DNA 測序技術成功閱讀了這本書,雖然略有瑕疵地發現了22個錯誤。
幾個月后,歐洲生物信息研究所采用另一種策略,同樣將大小為739千字節的文件寫入人工合成DNA中,讀取正確率接近100%。
這兩項研究讓人們看到了DNA存儲技術的希望,也開啟了研發熱潮。之后,存儲數據的大小不斷突破上限,從22兆字節,到200兆字節,再到維基百科所有16GB 的數據。
DNA數據存儲設備。|Takahashi et al, 2019DNA數據存儲設備。|Takahashi et al, 2019
不過,人工合成DNA數據存儲技術要實現商業化應用,還有一些重大問題要解決。
一是成本過高,目前人工合成存儲1兆字節數據的DNA,需要3500美元,解碼過程還需要額外的1000美元。二是無論存儲還是讀取過程都需要專業設備,個人使用極不方便。三是DNA保存需要低溫環境,否則長時間容易發生 DNA 降解,導致數據失真或丟失。
活細菌蘊藏著新可能
既然人工合成 DNA 有缺陷,那能不能借用活細菌的 DNA 呢?比如大腸桿菌,在實驗室只需要少量的營養物質就能茁壯成長,成本應該也會低很多。
事實上,早在2017年,丘奇團隊就開創性地利用“基因魔剪” CRISPR–Cas 技術,將編碼信息的DNA片段送入細菌體內。CRISPR–Cas 系統可以對任何DNA序列進行精準修改,如將堿基A替換成堿基G,或者刪除、插入、替換一段特異的DNA序列,就像我們使用 Word 軟件編輯文字一樣。
實驗中,丘奇團隊將一些黑白圖像和一張飛馳駿馬動圖編碼為DNA序列,插入大腸桿菌的基因組中。在大腸桿菌經過多代繁殖后,研究人員仍然能夠還原動圖信息,正確率達90%以上。
左邊是飛馳駿馬動圖的原圖, 右邊是將該動圖存儲在活細菌中,并經過多代繁殖后恢復的動圖。 |SETH SHIPMAN左邊是飛馳駿馬動圖的原圖, 右邊是將該動圖存儲在活細菌中,并經過多代繁殖后恢復的動圖。 |SETH SHIPMAN
這一次,哥倫比亞大學的研究人員則進一步發展了該方法。他們用電化學方法調控 CRISPR 系統看是否行使功能。需要存儲的二進制信息先被轉換為DNA序列,并插入環狀質粒(一種穩定的DNA環),然后隨質粒轉入大腸桿菌體內。
通過改變化學試劑的濃度,就可以改變細菌周圍的電壓,這時一些特定的環狀質??截悢禃@著增加。CRISPR 系統感知到這種變化,并將質粒中的插入片段(目標DNA序列)寫入細菌基因組,在生物體內實現數據信息的自動存儲——這就像為存儲動作設置了一個開關。
通過感受周圍電壓變化,大腸桿菌將質粒中的目標片段自動寫入基因組。|Sproetniek/iStock通過感受周圍電壓變化,大腸桿菌將質粒中的目標片段自動寫入基因組。|Sproetniek/iStock
為了研究該方法的可行性,研究人員將“hello world”錄入大腸桿菌的DNA中,并測試它們繁衍80代后,所攜帶的信息是否仍然穩定,結果發現正確率達90%以上。他們還將大腸桿菌混入土壤微生物中,對混合物進行測序,仍然可以恢復存儲的信息。
信息編碼為DNA序列,之后或者直接導入大腸桿菌中,或者先插入環狀質粒,再轉入大腸桿菌。|MDPI信息編碼為DNA序列,之后或者直接導入大腸桿菌中,或者先插入環狀質粒,再轉入大腸桿菌。|MDPI
當然,對活細菌存儲數字信息的研究目前才剛剛開始,還有很多技術難題需要攻克。不過,隨著眾多科學家和大型企業的加入,這些技術難題將被一一解決。相信在不遠的將來,DNA數據存儲設備將隨處可見。
那時,我們或許可以通過解碼存放在小試管里或活細菌中的一段DNA,來閱讀一本科幻小說,聽一段搖滾樂,觀看一部大制作電影。甚至如今存儲在電子設備中的任何文件,將來都能在DNA數據存儲設備中找到。
來源:十點科學
IT時代網(關注微信公眾號ITtime2000,定時推送,互動有福利驚喜)所有原創文章版權所有,未經授權,轉載必究。
創客100創投基金成立于2015年,直通硅谷,專注于TMT領域早期項目投資。LP均來自政府、互聯網IT、傳媒知名企業和個人。創客100創投基金對IT、通信、互聯網、IP等有著自己獨特眼光和豐富的資源。決策快、投資快是創客100基金最顯著的特點。
小何
小何
小何
小何