92视频呻吟久久Alr,日韩亚洲视频一区,青青操日本逼碰碰,亚洲欧美日韩中文一区,国产偷自拍,精品一区在线,亚洲精品在线久久,九九国产精品人妻,天堂影视麻豆


  • 免費(fèi)服務(wù)熱線
  • 400-065-6886
  • 電話:86(0)512-6295 9990
  • 傳真:86(0)512-6295 9995
新聞中心

利用下一代測序數(shù)據(jù)挖掘和開發(fā)SSR標(biāo)記方法及軟件簡介

發(fā)稿時(shí)間:2018-06-26來源:天昊生物


微衛(wèi)星或簡單重復(fù)序列(SSR)是基因組中信息非常豐富、用途也很廣泛的一種遺傳標(biāo)記。然而傳統(tǒng)的SSR分子標(biāo)記開發(fā)常常是一項(xiàng)耗時(shí)費(fèi)力及花費(fèi)很大的工作。隨著下一代高通量測序數(shù)據(jù)的快速積累,利用測序數(shù)據(jù)進(jìn)行SSR分子標(biāo)記挖掘便成了更加高效的方法。今年2月13日發(fā)表在Molecules上的文章“Mining and Development of Novel SSR Markers Using Next Generation Sequencing (NGS) Data in Plants”就這一問題進(jìn)行了系統(tǒng)的梳理。

 

 

一、SSR的重要性及其作為遺傳標(biāo)記的應(yīng)用

SSR是一個(gè)串聯(lián)重復(fù)序列的亞類,由在所有原核生物和真核生物的基因組中發(fā)現(xiàn)的長度為1-6個(gè)核苷酸(基序)組成。在單個(gè)基因型中,由于SSR基序的串聯(lián)陣列改變,重復(fù)單元的數(shù)量可能不同。因此,隨著重復(fù)單元的增加,基因型的多樣性也相應(yīng)增加。同樣,基序長度也影響重復(fù)的數(shù)量。

有大量SSR基因座分布在整個(gè)基因組中,特別是在真核生物的常染色質(zhì)中,以及在編碼和非編碼細(xì)胞核和細(xì)胞器DNA中。由于微衛(wèi)星信息豐富,突變率高,特異性強(qiáng),種內(nèi)多態(tài)性高,重復(fù)性好,易于數(shù)據(jù)化,多等位,跨分類群頻繁出現(xiàn)特點(diǎn),此外,SSRs的共顯性特性允許直接測量雜合性,并且只需要少量DNA用于數(shù)據(jù)收集,因此微衛(wèi)星得到了廣泛應(yīng)用。值得注意的是,它們被廣泛應(yīng)用于不同的目的,例如(1)遺傳多樣性;(2)發(fā)現(xiàn)數(shù)量性狀基因座(QTL);(3)基因與標(biāo)記連鎖圖譜的構(gòu)建;(4)標(biāo)記輔助選擇所需性狀(MAS);(5)法醫(yī)學(xué)和親子鑒定;(6)品種DNA指紋圖譜;(7)全基因組關(guān)聯(lián)研究;(8)基因流估計(jì);(9)標(biāo)記輔助育種(MAS);(10)單倍型測定;(11)雜種優(yōu)勢利用;(12)種質(zhì)鑒定;(13)遺傳診斷、轉(zhuǎn)化體鑒定和細(xì)胞及組織鑒定。

SSR根據(jù)來源進(jìn)行分類,主要分為基因組SSRs (g-SSRs)和表達(dá)序列標(biāo)簽SSRs (EST-SSRs),(注:還有一些其他命名方法,比如來源于核DNA的ncSSR,葉綠體DNA的cpSSR和線粒體DNA的mtSSR等)。EST-SSRs具有開發(fā)成本低、遺傳多樣性水平高以及向相關(guān)類群的轉(zhuǎn)移能力強(qiáng)。相比之下,基因組SSRs由于引物結(jié)合位點(diǎn)的重復(fù)區(qū)域或簡并性而具有較小的種間可轉(zhuǎn)移性。盡管EST-SSRs的一個(gè)主要不足是在同一位點(diǎn)產(chǎn)生多組標(biāo)記的序列冗余,但是這個(gè)問題可以通過將EST組裝成單基因來解決。因此,EST-SSRs標(biāo)記已經(jīng)開發(fā)并在許多植物物種中使用,例如水稻、小麥、大麥、高粱、番茄、咖啡、橡膠、蓖麻和芝麻等。

 

二、SSR開發(fā)方法

SSR的開發(fā)可以依賴基因組DNA序列,也可以依賴由單鏈RNA (cDNA)合成的雙鏈DNA,這取決于項(xiàng)目目標(biāo)、未來的研究方案以及研究人員管理輸出數(shù)據(jù)的能力。使用DNA直接測序更為直接,轉(zhuǎn)錄組測序(RNA-Seq )作為成功和有效的方法也可用于SSR挖掘,特別是用于沒有參考基因組(從頭組裝)的植物(表1)。

 

表1、利用下一代測序技術(shù)開發(fā)的一些植物簡單序列重復(fù)(SSR)標(biāo)記列表

 

三、利用Illumina平臺(tái)進(jìn)行的轉(zhuǎn)錄組開發(fā)SSR過程概述

轉(zhuǎn)錄組從頭組裝過程包括RNA提取、cDNA文庫構(gòu)建、測序、數(shù)據(jù)過濾和質(zhì)量控制、從頭組裝、單基因注釋、SSR搜索和引物設(shè)計(jì)以及標(biāo)記驗(yàn)證(圖1)。

圖1、從頭轉(zhuǎn)錄組測序和組裝過程的示意圖

 

1、從頭組裝

用于從頭組裝RNA-Seq reads的工具有多種,例如Multiple-k、Rnnotator、Trans-ABySS、Velvet-Oases和SOAPdenovo-Trans。Trinity是一種近來越來越流行的轉(zhuǎn)錄組從頭組裝工具,它為序列讀取生成單獨(dú)的de Bruijn圖。因此,每一個(gè)de Bruijn圖指示了某一基因或基因座的轉(zhuǎn)錄復(fù)雜性,該基因或基因座被單獨(dú)處理以獲得全長剪接亞型,并梳理從同源基因提取的轉(zhuǎn)錄物。另外,Trinity先后應(yīng)用了三個(gè)軟件應(yīng)用程序,即Inchworm,Chrysalis和Butterfly來管理大量的reads。該過程簡要描述如下:

Inchworm:通過用最多的k-mers擴(kuò)展序列,將reads組合成獨(dú)特的轉(zhuǎn)錄本序列,然后只匯集不同剪接的轉(zhuǎn)錄本的特有部分。

Chrysalis:將Inchworm contigs按k-1重疊組成簇,為每個(gè)簇構(gòu)建de Bruijn圖組件,代表具有共同序列的一個(gè)或多個(gè)給定基因的完整轉(zhuǎn)錄情況。接下來,在簇之間劃分完整的read集合。

Butterfly:并行獨(dú)立解析拼接轉(zhuǎn)錄本,最終形成全長轉(zhuǎn)錄本。

Trinity產(chǎn)生的轉(zhuǎn)錄本應(yīng)用于TGICL ( TIGR基因指數(shù)聚類工具)管線聚類的基因家族。此外,為了獲得最終的單基因(如果有多個(gè)樣品),TGICL將對每個(gè)樣品的單基因再次計(jì)算,以獲得最終的單基因(用于下游分析)。單基因?qū)⒈环殖砂鄠€(gè)相似度超過70 %的簇和單基因singletons(圖2)。

圖2、轉(zhuǎn)錄組從頭組裝過程示意圖

 

2、單基因功能注釋

使用的功能數(shù)據(jù)庫包括NCBI的非冗余核苷酸序列數(shù)據(jù)庫(NT)和非冗余蛋白質(zhì)序列數(shù)據(jù)庫(NR)。此外,還包括Swiss-Prot、Pfam、KOG、GO和KEGG等數(shù)據(jù)庫。所有數(shù)據(jù)庫都使用Blast對齊組裝的單基因,以獲得每個(gè)單基因的注釋功能。對于NR注釋,可以使用Blast2GO或AmiGO獲得單基因的基因本體注釋?;虮倔w(GO)是一項(xiàng)重要的生物信息學(xué)聯(lián)合項(xiàng)目,旨在解決在分子、細(xì)胞和組織系統(tǒng)級別上跨數(shù)據(jù)庫生物功能的描述。

3、SSR挖掘和鑒定工具

為了在單基因中進(jìn)行SSR挖掘和鑒定,人們開發(fā)出多種生信工具,比如MISA (MIcroSAtellitehttp://pgrc.ipk-gatersleben.de/misa/)和SSRLocator (http://www.microsatellite.org/ssr.php)。然而,這些工具無法有效地處理大基因組序列,統(tǒng)計(jì)數(shù)據(jù)也不夠準(zhǔn)確。基于全基因組微衛(wèi)星開發(fā)的分析工具GMATo結(jié)果更快、更精確,可以針對任何大小基因組完成SSR分析。最近,研究人員開發(fā)了一款新的軟件包GMATA,它通過映射和圖形化的方式為快速SSR分析、標(biāo)記開發(fā)和多態(tài)性篩選提供了新的策略和全面的解決方案,并將結(jié)果顯示在具有其他基因特征的基因組瀏覽器中。此外,該軟件還提供了高質(zhì)量的統(tǒng)計(jì)圖表。GMATA軟件只使用側(cè)翼序列作為設(shè)計(jì)PCR引物的模板,減少了計(jì)算內(nèi)存,加快了大數(shù)據(jù)序列的設(shè)計(jì)過程。

4、DNA分離、PCR擴(kuò)增和SSR驗(yàn)證

為了驗(yàn)證SSRs,需要提取DNA,合成目標(biāo)SSR引物,通過PCR在不同植物品種或材料中進(jìn)行擴(kuò)增試驗(yàn)檢測,最后選擇成功的引物進(jìn)行后續(xù)如遺傳多樣性研究等。

 

四、基于下一代數(shù)據(jù)中SSRs基因分型工具

最近,已經(jīng)開發(fā)了許多軟件工具來分析NGS數(shù)據(jù)中的SSRs,例如LobSTR、RepeatSeq、STRViper、STR-FM、PSR、rAmpSeq和STRScan。LobSTR運(yùn)行時(shí)間快,在基因分型階段考慮PCR stutter噪聲。然而,對于單核苷酸SSRs和短于25bp的SSRs,LobSTR敏感性低。RepeatSeq工具是使用來自近交果蠅系誤差分布圖發(fā)布的。該工具利用其他程序繪制的讀數(shù),,并根據(jù)SSR基序、長度和堿基質(zhì)量預(yù)測基因座最可能的基因型。然而,RepeatSeq的局限在于使用全部read作圖法,這種方法在參考基因組中引入了對SSR長度的偏向,從而可能模糊真實(shí)的SSR變異譜。STR-FM (使用基于側(cè)翼短串聯(lián)重復(fù)的映射方法)被開發(fā)為用于從短讀取測序數(shù)據(jù)中檢測SSR并對其進(jìn)行基因分型的靈活管線。另一種利用成對末端信息從深度測序數(shù)據(jù)中檢測SSR變異的方法是STRViper。STRViper預(yù)測了基因組群體中的多態(tài)性重復(fù)序列,并發(fā)現(xiàn)了幾個(gè)多態(tài)性重復(fù)序列,除了LobSTR使用自己的對齊工具之外,所有工具都需要預(yù)先對齊的數(shù)據(jù)。STRViper的性能在很大程度上取決于碎片大小的差異。

上述所有工具主要用于從SAM / BAM數(shù)據(jù)中分析SSR,它們從NGS數(shù)據(jù)中識(shí)別每個(gè)位點(diǎn)的gSSR等位基因。與上述工具不同,多態(tài)SSR檢索工具(PSR)是為了從NGS數(shù)據(jù)中識(shí)別多態(tài)SSR而開發(fā)的,其中在非模式植物物種中,它們使用從頭轉(zhuǎn)錄組作為SSR挖掘的第一序列資源,從而更有效地挖掘。2016年人們開發(fā)出了rAmpSeq重復(fù)擴(kuò)增測序工具,適用于大多數(shù)物種的基因分型,使用低質(zhì)量的DNA并產(chǎn)生多個(gè)標(biāo)記,從而便于以每份樣品更低的成本進(jìn)行全基因組測序。另一個(gè)軟件工具STRScan是為從基因組序列中生信挖掘SSRs而開發(fā)的,它比LobSTR和STR-FM具有更高的靈敏度。它在NGS數(shù)據(jù)中使用了一種特定的算法,對來自Sanger測序儀和Illumina測序儀的全基因組測序( WGS )數(shù)據(jù)進(jìn)行有針對性的SSR分析。結(jié)果表明,STRScan可以在較短的計(jì)算時(shí)間內(nèi)將目標(biāo)集中被LobSTR遺漏的SSRs多達(dá)

關(guān)于天昊:

天昊生物具備完整的轉(zhuǎn)錄組(RNA-Seq)及全轉(zhuǎn)錄組檢測服務(wù)產(chǎn)品線,同時(shí)擁有多種SSR檢測平臺(tái)及SSRseqTM等專利技術(shù),可以針對客戶具體項(xiàng)目需求,提供不同數(shù)量樣本和SSR位點(diǎn)的高性價(jià)比SSR檢測驗(yàn)證服務(wù)。

Copyright ? 2012-2025 天昊基因科技(蘇州)有限公司    All Rights Reserved    蘇ICP備17064027號(hào)-1
大埔县| 石家庄市| 仪征市| 博野县| 察隅县| 云林县| 和顺县| 化隆| 久治县| 台北市| 綦江县| 乐陵市| 柳州市| 寻乌县| 湾仔区| 布拖县| 白银市| 仙桃市| 合肥市| 西昌市| 托克逊县| 曲阳县| 澄江县| 滦平县| 茶陵县| 石景山区| 霍城县| 永吉县| 博客| 汉沽区| 伊吾县| 右玉县| 迭部县| 西宁市| 田阳县| 宝清县| 滁州市| 兴业县| 乐业县| 东明县| 五寨县|