基因組解析多脈冬青環(huán)境適應機制
冬青屬(Ilex)植物廣布于全球熱帶至溫帶沿海地區,植物形態(tài)和生境豐富多樣,茶飲、藥用和觀(guān)賞等經(jīng)濟價(jià)值極高。東亞和南美洲的熱帶、亞熱帶地區是冬青屬物種多樣性熱點(diǎn)地區,尤其是我國西南熱帶、亞熱帶地區種類(lèi)最多。由于我國西南地區地理和氣候類(lèi)型變化多樣,冬青屬植物在該區域演化出大量狹域種和少數廣布種。廣布種的種群可通過(guò)歧化選擇發(fā)生本地適應,進(jìn)而發(fā)生遺傳和表型特征的分化,這為冬青植物資源的保護和利用提供新的材料;然而歧化選擇也可能因種群間頻繁的基因交流而被減弱。迄今冬青科乃至整個(gè)冬青目都缺少已知的全基因組信息,極大限制了對冬青屬植物環(huán)境適應和遺傳分化的研究。
版納植物園生物多樣性研究組姚昕博士與合作者選擇西南地區廣布且觀(guān)賞價(jià)值較高的多脈冬青(圖1)為研究對象,利用種群基因組學(xué)研究方法解析物種對不同海拔適應和遺傳分化的分子機制。該研究整合Illumina二代、PacBio三代和Hi-C測序技術(shù),通過(guò)從頭組裝出多脈冬青染色體水平的參考基因組。其中,contigs N50長(cháng)度5,124,369 bp,最長(cháng)的contig為23,338,240 bp;scaffords N50長(cháng)度36,593,620bp,最長(cháng)的scafford為64,863,080 bp。最終利用62條scaffords獲得的多脈冬青的全基因組為727.1 Mb,利用BUSCO評分達到97.6%;基因組組裝結果被定位到20條染色體上的覆蓋度達到98.9%。基于高質(zhì)量的組裝結果,我們共注釋出32,838個(gè)蛋白質(zhì)編碼基因,其中96.9%的基因能夠在主流基因功能數據庫中檢索到其功能。
進(jìn)一步結合菊分支(asterids)其他5個(gè)物種全基因組數據進(jìn)行基因組加倍事件分析,發(fā)現冬青屬經(jīng)歷了2次全基因組加倍事件(圖2)。基于多脈冬青高質(zhì)量的參考基因組,對覆蓋其所有分布海拔范圍的21個(gè)種群、112個(gè)個(gè)體的種群基因組學(xué)分析表明絕大多數種群被分為4個(gè)分支,分別對應不同的地理位置和海拔(圖3a,b)。種群遺傳結構和遺傳主成分分析結果表明這些種群最可能存在4個(gè)祖先成分,低海拔(<1,500 m)和高海拔(>1,800 m)種群各對應2個(gè)祖先成分,中等海拔(1,500–1,800 m)種群是由低海拔和高海拔種群的祖先成分混雜組成(圖3c,d,e,f)。連鎖不平衡衰減分析發(fā)現連鎖不平衡系數衰減速度最快的是低海拔種群,其次是高海拔種群,最慢的是中等海拔種群。選擇消除分析共鑒定出34個(gè)受海拔選擇的候選基因(圖3g),它們的功能大多與響應生物和非生物選擇壓力有關(guān)。
相關(guān)研究結果以A chromosome-scale genome assembly for the holly (Ilex polyneura) provides insights into genomic adaptations to elevation in Southwest China為題,近日在SCI期刊園藝領(lǐng)域(Horticulture)排名第一的期刊Horticulture Research上正式發(fā)表。本研究不僅是整個(gè)冬青目中首個(gè)染色體水平參考基因組的研究,也為推進(jìn)冬青屬植物演化生物學(xué)研究,以及加快冬青園藝品種、茶飲和藥用資源的選擇馴化工作,提供了必要基礎。
此外,我們使用冬青屬主要分布區的主要語(yǔ)言(英語(yǔ)、漢語(yǔ)、葡萄牙語(yǔ)和西班牙語(yǔ)),在谷歌學(xué)術(shù)、Web of Sciences、中國知網(wǎng)和南美洲主要學(xué)術(shù)搜索引擎Scientific Electronic Library Online (SciELO)中檢索冬青屬植物應用的文獻資料,綜述該屬植物在全世界各主要分布區被應用的現狀。隨后,討論我們于2021年發(fā)表的世界冬青屬系統發(fā)育研究結果和最近發(fā)表的冬青高質(zhì)量參考基因組,對冬青屬植物資源開(kāi)發(fā)和育種工作的促進(jìn)。這一成果以Utilization of the Hollies (Ilex L. spp.): A Review為題,近日在期刊Forests上正式發(fā)表。
以上研究受?chē)易匀豢茖W(xué)基金、中國科學(xué)院西部青年學(xué)者項目和云南省基礎研究計劃共同資助,在此一并感謝。
圖1. 多脈冬青(Ilex polyneura)落葉后的雌樹(shù)(a)、果實(shí)(b)、雌花序(c)和雄花序(d)。
圖2. 基于多脈冬青和菊分支(asterids)5個(gè)物種的全基因組加倍事件分析。圖中Ilex表示多脈冬青(Ilex polyneura),Lsat表示萵苣(Lactuca sativa),Dcar表示胡蘿卜(Daucus carota),Hann表示向日葵(Helianthus annuus),Mgut表示溝酸漿屬植物(Mimulus guttatus),Slyc表示番茄(Solanum lycopersicum)。
圖3.多脈冬青種群基因組學(xué)分析。a,本研究多脈冬青種群的分布信息。b,基于鄰接法(neighbor-join)的多脈冬青種群系統發(fā)育關(guān)系。c,多脈冬青種群遺傳結構分析(K=4)(綠色、藍色和紅色分別表示低海拔、中等海拔和高海拔種群)。D和c,多脈冬青種群遺傳主成分分析。f,多脈冬青種群遺傳結構K值的交叉驗證。g,多脈冬青種群連鎖不平衡衰減分析(黑色、綠色、藍色和紅色分別表示所有種群以及低海拔、中等海拔和高海拔種群)