科學家被細菌愚弄了嗎?新的機器學習算法揭示了DNA的真相

發現:免疫治療癌癥患者有害的腸道細菌可能比有益的細菌更重要

DNA遺傳學

以前對基因開關的研究可能會被污染所混淆,但西奈山的科學家們創造了一種新工具,可以準確地確定它是否在人類疾病中發揮作用。

幾十年來,一小群尖端醫學研究人員一直在研究一種可以打開或關閉基因的生化DNA標記系統。許多人已經在細菌中研究過它,現在有些人已經在植物、蒼蠅甚至人類腦腫瘤中看到了它的跡象。然而,根據西奈山伊坎醫學院研究人員的一項新研究,可能存在一個障礙:它存在于高等生物中的大部分證據可能是由于細菌污染,而使用目前的實驗很難發現這種污染方法。

為了解決這個問題,科學家們創建了一種量身定制的基因測序方法,該方法依靠一種新的機器學習算法來準確測量標記 DNA 的來源和水平。這有助于他們將細菌 DNA 與人類和其他非細菌細胞的 DNA 區分開來。雖然發表在《科學》雜志上的結果支持這一系統可能在非細菌細胞中自然發生的觀點,但其水平遠低于以前的一些研究報告,并且很容易受到細菌污染或當前實驗方法的影響。對人腦癌細胞的實驗產生了類似的結果。

“突破醫學研究的界限可能具有挑戰性。有時這些想法是如此新穎,以至于我們不得不重新考慮我們用來測試它們的實驗方法,”伊坎西奈山遺傳學和基因組科學副教授方剛博士說。“在這項研究中,我們開發了一種新方法,可有效測量多種物種和細胞類型中的這種 DNA 標記。我們希望這將有助于科學家發現這些過程可能在進化和人類疾病中發揮的許多作用。”

西奈山伊坎醫學院的研究人員開發了一種先進的方法來確定細胞是否可以使用一種模糊的 DNA 標記系統來打開或關閉基因。圖片由紐約州西奈山的 Do lab 提供

研究的重點是 DNA 腺嘌呤甲基化,這是一種生化反應,將一種稱為甲基的化學物質連接到腺嘌呤上,腺嘌呤是用于構建長 DNA 鏈和編碼基因的四種構件分子之一。這可以“表觀遺傳”激活或沉默基因,而無需實際改變 DNA 序列。例如,眾所周知,腺嘌呤甲基化在一些細菌如何防御病毒方面發揮著關鍵作用。

幾十年來,科學家們認為腺嘌呤甲基化嚴格發生在細菌中,而人類和其他非細菌細胞依賴于不同結構單元——胞嘧啶——的甲基化來調節基因。然后,從 2015 年左右開始,這種觀點發生了變化。科學家們在植物、蒼蠅、小鼠和人類細胞中發現了高水平的腺嘌呤甲基化,這表明該反應在整個進化過程中發揮了更廣泛的作用。

然而,進行這些初步實驗的科學家們面臨著艱難的權衡取舍。一些使用的技術可以精確測量任何細胞類型的腺嘌呤甲基化水平,但無法識別每條 DNA 來自哪個細胞,而另一些則依賴于可以發現不同細胞類型的甲基化但可能高估反應水平的方法。

在這項研究中,方博士的團隊開發了一種名為 6mASCOPE 的方法,克服了這些權衡。在其中,從組織或細胞樣本中提取 DNA,并被稱為酶的蛋白質切成短鏈。將這些鏈放入顯微孔中,并用酶處理,生成每條鏈的新副本。然后,先進的測序儀實時測量每個核苷酸構件添加到新鏈中的速率。甲基化腺嘌呤會稍微延遲這個過程。然后將結果輸入機器學習算法,研究人員訓練該算法從測序數據中估計甲基化水平。

“DNA 序列使我們能夠確定哪些細胞(人類或細菌)發生了甲基化,而機器學習模型分別量化了每個物種的甲基化水平,”Fang 博士說,

對簡單的單細胞生物體(如綠藻)的初步實驗表明,6mASCOPE 方法是有效的,因為它可以檢測兩種都具有高水平腺嘌呤甲基化的生物體之間的差異。

該方法似乎還可以有效地量化復雜生物體中的腺嘌呤甲基化。例如,以前的研究表明,高水平的甲基化可能在果蠅黑腹果蠅和開花雜草擬南芥的早期生長中發揮作用。在這項研究中,研究人員發現這些高水平的甲基化主要是污染細菌 DNA 的結果。實際上,這些實驗中的果蠅和植物 DNA 只有微量的甲基化。

熒光顯微鏡

細胞研究用熒光顯微鏡

同樣,對人體細胞的實驗表明甲基化在健康和疾病條件下都以非常低的水平發生。從患者血液樣本中獲得的免疫細胞 DNA 只有微量的甲基化。

從膠質母細胞瘤腦腫瘤樣本中分離的 DNA 也觀察到了類似的結果。這一結果與之前的研究不同,之前的研究報告了腫瘤細胞中更高水平的腺嘌呤甲基化。然而,正如作者指出的那樣,可能需要更多的研究來確定這種差異在多大程度上可能是由于腫瘤亞型的差異以及其他潛在的甲基化來源造成的。

最后,研究人員發現,科學家經常用來操縱基因的質粒 DNA 可能被源自細菌的高水平甲基化污染,這表明該 DNA 可能是未來實驗中的污染源。

“我們的結果表明,腺嘌呤甲基化的測量方式會對實驗結果產生深遠的影響。我們并不是要排除某些人體組織或疾病亞型可能具有高度豐富的 DNA 腺嘌呤甲基化的可能性,但我們確實希望 6mASCOPE 能夠通過排除細菌污染的偏差來幫助科學家全面研究這個問題,”Gang 博士說。“為了幫助解決這個問題,我們向其他研究人員廣泛提供了 6mASCOPE 分析軟件和詳細的操作手冊。”

Reference: “Critical assessment of DNA adenine methylation in eukaryotes using quantitative deconvolution” by Yimeng Kong, Lei Cao, Gintaras Deikus, Yu Fan, Edward A. Mead, Weiyi Lai, Yizhou Zhang, Raymund Yong, Robert Sebra, Hailin Wang, Xue-Song Zhang and Gang Fang, 3 February 2022, Science.
DOI: 10.1126/science.abe7489

這項工作得到了美國國立衛生研究院 (GM139655、HG011095、AG071291) 的支持;伊坎基因組學和多尺度生物學研究所;Irma T. Hirschl/Monique Weill-Caulier 信托基金;納什家庭基金會;和西奈山伊坎醫學院的科學計算系。質譜方法驗證得到了中國科學院 (XDPB2004) 和中國國家自然科學基金 (22021003) 的合作者的支持。