CRISPRlnc數(shù)據(jù)庫(kù)助力長(zhǎng)非編碼RNA相關(guān)CRISPR/Cas9研究
長(zhǎng)非編碼RNA ( long noncoding RNA, lncRNA ) 是一類長(zhǎng)度大于200核苷酸卻不編碼蛋白質(zhì)的非編碼RNA。lncRNA含量巨大,來(lái)源廣泛,種類繁多,功能復(fù)雜。近年來(lái)隨著高通量基因組技術(shù)的發(fā)展,人們對(duì)lncRNA的研究興趣急劇上升,這個(gè)領(lǐng)域的重要發(fā)現(xiàn)多次被Science雜志歸入“年度十大科學(xué)發(fā)現(xiàn)”,在Science雜志評(píng)選的二十一世紀(jì)頭十年十大科學(xué)突破中,RNA研究特別是非編碼RNA研究更是被列在首位。盡管大量研究證實(shí)lncRNA在很多生物過程中發(fā)揮重要作用,但我們對(duì)lncRNA功能和機(jī)制了解得還不夠深入。CRISPR/Cas9系統(tǒng)作為革命性的基因編輯工具在分子生物學(xué)領(lǐng)域得到了廣泛的應(yīng)用,也為深入研究lncRNA的功能和機(jī)制提供了必要的手段。使用CRISPR/Cas9進(jìn)行基因編輯的第一步是設(shè)計(jì)針對(duì)靶標(biāo)基因的sgRNA(single guide RNA),但是可能會(huì)有效率低或者脫靶效應(yīng)等問題,而lncRNA相對(duì)于編碼基因在基因組定位、行使功能方式等方面的特殊性讓相應(yīng)sgRNA的設(shè)計(jì)更為困難。因此收集和分析實(shí)驗(yàn)驗(yàn)證過的sgRNA對(duì)于lncRNA相關(guān)CRISPR/Cas9研究有著非常重要的意義。
通過計(jì)算機(jī)輔助的文獻(xiàn)挖掘和人工確認(rèn),版納植物園生物信息研究組整理收集了大量lncRNA相關(guān)CRISPR/Cas9實(shí)驗(yàn)數(shù)據(jù)及其相關(guān)文獻(xiàn),并在此基礎(chǔ)上建立了國(guó)際上首個(gè)實(shí)驗(yàn)驗(yàn)證的lncRNA相關(guān)sgRNA數(shù)據(jù)庫(kù)CRISPRlnc (http://crisprlnc.xtbg.ac.cn)。這一工作將為使用CRISPR/Cas9系統(tǒng)研究lncRNA的功能和機(jī)制提供有力的幫助,并為下一步針對(duì)lncRNA sgRNA探針設(shè)計(jì)的計(jì)算機(jī)輔助算法開發(fā)打下基礎(chǔ)。在第一版CRISPRlnc數(shù)據(jù)庫(kù)中共收集了包括哺乳動(dòng)物、昆蟲和植物多個(gè)物種在內(nèi)的共計(jì)305條lncRNA基因及其對(duì)應(yīng)的2102條sgRNA。對(duì)于每一條lncRNA收集了ID、序列、基因組中的位置、功能描述等信息和相應(yīng)的sgRNA的ID、序列、基因組中的位置、PAM基序、CRISRP類型、活性等信息。CRISPRlnc數(shù)據(jù)庫(kù)提供了瀏覽、搜索、下載、基因組瀏覽器、BLAST等功能,同時(shí)提供了詳細(xì)的幫助文檔。另外,通過對(duì)所收集數(shù)據(jù)的研究,CRISPRlnc數(shù)據(jù)庫(kù)還對(duì)lncRNA相關(guān)sgRNA設(shè)計(jì)的位置偏好、CRISPR/Cas9功能類型等特征進(jìn)行了統(tǒng)計(jì)分析。分析表明經(jīng)實(shí)驗(yàn)驗(yàn)證的sgRNA設(shè)計(jì)位置更傾向于lncRNA基因的5′端(約占61.4%)或者上游轉(zhuǎn)錄調(diào)控區(qū)(約占12.6%),CRISPR/Cas9功能類型主要為CRISPR interference ( CRISPRi,約占52.1%)。
這一研究以CRISPRlnc: a manually curated database of validated sgRNAs for lncRNAs為題在線發(fā)表在國(guó)際著名學(xué)術(shù)期刊Nucleic Acids Research上(影響因子11.56,Rank 10/292)。
CRISPRlnc數(shù)據(jù)庫(kù)概覽