中大新聞網(wǎng)訊(通訊員楊建華)逆轉(zhuǎn)錄轉(zhuǎn)座子(Retrotransposons)在大多數(shù)物種中都普遍存在,能夠通過(guò)“復(fù)制-粘貼”機(jī)制進(jìn)行大量擴(kuò)增,在人類(lèi)基因組中占比超過(guò)35%。逆轉(zhuǎn)錄轉(zhuǎn)座子可以為創(chuàng)造新的功能基因提供原料,是進(jìn)化多樣性的最主要來(lái)源之一。它們能引發(fā)現(xiàn)有基因序列的改變,或充當(dāng)新基因的啟動(dòng)子,影響基因選擇性剪接,甚至促使新基因形成。具有表達(dá)潛能的逆轉(zhuǎn)錄轉(zhuǎn)座子對(duì)人體生理、組織分化、癌癥的發(fā)生發(fā)展具有深遠(yuǎn)的影響,且被認(rèn)為在哺乳動(dòng)物大腦進(jìn)化中扮演重要角色。然而,現(xiàn)有的逆轉(zhuǎn)錄轉(zhuǎn)座子檢測(cè)方法存在局限,需要已知確切序列,然后進(jìn)行有監(jiān)督的同源搜索。研究通常僅限于幾種經(jīng)典的LINE/SINE元件,缺乏全面系統(tǒng)的基因組尺度探索。因此,各種類(lèi)型的逆轉(zhuǎn)錄轉(zhuǎn)座子在全基因組的精確分布圖譜、生物生成、動(dòng)態(tài)變化、潛在功能和作用機(jī)制仍有待闡明。
近日,中山大學(xué)生命科學(xué)學(xué)院楊建華/屈良鵠教授團(tuán)隊(duì)開(kāi)發(fā)了在全基因組檢測(cè)逆轉(zhuǎn)錄轉(zhuǎn)座子的新計(jì)算方法retroSeeker。通過(guò)將逆轉(zhuǎn)錄轉(zhuǎn)座子事件的生物學(xué)模型(復(fù)制-粘貼)映射到比較基因組學(xué)數(shù)據(jù)(gap和fill)中,retroSeeker算法能夠準(zhǔn)確地識(shí)別任何物種基因組中的新逆轉(zhuǎn)錄轉(zhuǎn)座子。具體而言,親本基因的存在產(chǎn)生了一個(gè)“填充”(fill)區(qū)域,而“復(fù)制-粘貼”過(guò)程則在新的基因座產(chǎn)生了一個(gè)“間隙”(gap)區(qū)域,通過(guò)將物種間的基因組進(jìn)行兩兩比對(duì),可以復(fù)現(xiàn)這些“填充”和“間隙”區(qū)域以獲得候選的轉(zhuǎn)座子區(qū)域 (圖1A)。此外,根據(jù)逆轉(zhuǎn)錄轉(zhuǎn)座的TPRT(target-site primed reverse transcription)機(jī)制,逆轉(zhuǎn)錄轉(zhuǎn)座子的復(fù)制往往還需要借助其poly(A) 尾巴,且在插入新基因座后,逆轉(zhuǎn)錄轉(zhuǎn)座子兩側(cè)還會(huì)形成標(biāo)志性的TSD(target site duplications)序列。因此,一旦retroSeeker確定了潛在的逆轉(zhuǎn)錄區(qū)域,它會(huì)立即利用動(dòng)態(tài)規(guī)劃算法對(duì)側(cè)翼的TSD和poly(A)序列進(jìn)行搜索和評(píng)分,最終獲得高置信度的逆轉(zhuǎn)錄轉(zhuǎn)座子候選 (圖1A)。通過(guò)模擬數(shù)據(jù)和真實(shí)數(shù)據(jù)的測(cè)試,retroSeeker算法表現(xiàn)出高度特異性、高靈敏度和快速的運(yùn)行速度。(圖1B-E)。

圖1 鑒定逆轉(zhuǎn)錄轉(zhuǎn)座子的新計(jì)算方法retroSeeker概覽
應(yīng)用retroSeeker算法于人、小鼠和果蠅基因組,retroSeeker鑒定了大批新類(lèi)型的逆轉(zhuǎn)錄轉(zhuǎn)座子,并解碼它們的生物發(fā)生、表達(dá)、進(jìn)化和潛在功能。由于retroSeeker可對(duì)轉(zhuǎn)座子的插入位置進(jìn)行單堿基精度的鑒定,研究團(tuán)隊(duì)發(fā)現(xiàn)大多數(shù)新的逆轉(zhuǎn)錄轉(zhuǎn)座子表現(xiàn)出特定的L1內(nèi)切酶切割基序,其中一些基序精確地位于插入位點(diǎn)上游的10個(gè)核苷酸(圖2A)。結(jié)合大規(guī)模的基因表達(dá)數(shù)據(jù),發(fā)現(xiàn)大量的候選新功能基因可能通過(guò)逆轉(zhuǎn)錄轉(zhuǎn)位機(jī)制產(chǎn)生,例如,一些蛋白編碼基因本身不具備編碼miRNA的能力,但是通過(guò)逆轉(zhuǎn)錄轉(zhuǎn)座形成轉(zhuǎn)座子后,能夠進(jìn)一步產(chǎn)生新的miRNA基因(圖2B)。有趣的是,研究團(tuán)隊(duì)還發(fā)現(xiàn)了組蛋白基因、線(xiàn)粒體基因和vault RNA基因通過(guò)逆轉(zhuǎn)座子機(jī)制產(chǎn)生了新類(lèi)型的逆轉(zhuǎn)錄轉(zhuǎn)座子(圖2C-E)。結(jié)合ENCODE/CCLE大規(guī)模的組織/癌癥表達(dá)數(shù)據(jù),作者進(jìn)一步闡明了逆轉(zhuǎn)錄轉(zhuǎn)座子的組織特異性表達(dá),并證明了它們?cè)诟鞣N癌癥類(lèi)型中的普遍表達(dá)。最后,應(yīng)用retroSeeker算法于更多物種的基因組,揭示了逆轉(zhuǎn)錄轉(zhuǎn)座子的復(fù)雜進(jìn)化模式,并發(fā)現(xiàn)了許多物種特異性的逆轉(zhuǎn)錄轉(zhuǎn)座子事件(圖2F)。綜上,該研究開(kāi)不僅鑒定了逆轉(zhuǎn)錄轉(zhuǎn)座子在各物種基因組的精確分布圖譜,也為進(jìn)一步闡明逆轉(zhuǎn)錄轉(zhuǎn)座子的特性及其在生理和病理過(guò)程中的潛在作用提供了新算法。

圖2 應(yīng)用retroSeeker解碼逆轉(zhuǎn)錄轉(zhuǎn)座子的生物發(fā)生、表達(dá)、進(jìn)化和潛在功能
該研究以“RetroSeeker Reveals the Characteristics, Expression, and Evolution of a Large Set of Novel Retrotransposons”為題發(fā)表在Advanced Biotechnology。中山大學(xué)生命科學(xué)學(xué)院楊建華教授、屈良鵠教授為該項(xiàng)工作的共同通訊作者,博士研究生黃鈞鴻為本文的第一作者。該研究得到了國(guó)家自然科學(xué)基金、國(guó)家重點(diǎn)研發(fā)計(jì)劃等項(xiàng)目資助。
論文鏈接:https://link.springer.com/article/10.1007/s44307-023-00005-5