de novo基因組測(cè)序及分析
de novo測(cè)序(也叫從頭測(cè)序),是指不用任何參考序列而對(duì)某個(gè)物種進(jìn)行測(cè)序,用生物信息學(xué)方法進(jìn)行組裝,最終獲得該物種的基因組序列圖譜。
目前,全基因組測(cè)序已逐步成為各個(gè)物種基礎(chǔ)研究的重要手段之一。通過(guò)基于新一代高通量測(cè)序技術(shù)的全基因組測(cè)序,可以預(yù)測(cè)重要基因和蛋白以了解其功能和可能機(jī)制。在研究病原菌的致病性與疾病的預(yù)防和治療方面,可以鑒定致病相關(guān)基因、開(kāi)發(fā)和研究疫苗、開(kāi)發(fā)新型抗生素等;在研究細(xì)菌進(jìn)化方面,可以研究種內(nèi)進(jìn)化關(guān)系;合理利用有益真菌,對(duì)控制和預(yù)防有害真菌對(duì)人類(lèi)的生產(chǎn)和生活具有重要意義。在大型動(dòng)植物領(lǐng)域,更是對(duì)該物種的進(jìn)化研究,基因改良育種有重大的作用。
一、技術(shù)路線
de novo測(cè)序技術(shù)路線圖
二、技術(shù)指標(biāo)
|
基因組框架圖 |
基因組精細(xì)圖 |
基因組覆蓋率 |
>90% |
>95% |
基因區(qū)覆蓋率 |
>95% |
>98% |
Contig N50 |
>5 Kb |
>20 Kb |
Scaffold N50 |
>20 Kb |
>300 Kb |
單堿基錯(cuò)誤率 |
<0.01% |
<0.01% |
本指標(biāo)具體根據(jù)所分析的物種可能會(huì)有變化,請(qǐng)與當(dāng)?shù)劁N(xiāo)售代表聯(lián)系
三、 生物信息分析
可結(jié)合客戶(hù)的需求,協(xié)商確定定制化信息分析服務(wù)內(nèi)容。
四、 相關(guān)案例
圖a為裝配基因測(cè)序深度的分布;圖b為裝配基因與BAC序列的對(duì)比
圖a為對(duì)齊與不對(duì)齊的非重復(fù)序列的長(zhǎng)度;圖b為將人、熊貓和狗的染色體同線的位于同一條染色體上
五、 常見(jiàn)問(wèn)題
1. 第二代測(cè)序技術(shù)與傳統(tǒng)Sanger測(cè)序相比有什么優(yōu)勢(shì)?
答:第二代測(cè)序技術(shù)的測(cè)序通量是傳統(tǒng)Sanger法的上萬(wàn)倍,并且可以進(jìn)行長(zhǎng)片段雙末端測(cè)序,將測(cè)序數(shù)據(jù)拼接成較長(zhǎng)的Contig和Scaffold。與Scaffold法相比,具有高通量、高靈敏度、高準(zhǔn)確性、低成本和耗時(shí)短等多個(gè)突出優(yōu)勢(shì)。如人類(lèi)基因組測(cè)序是六個(gè)國(guó)家耗資27億多美元?dú)v經(jīng)10年才完成的,而如今利用第二代測(cè)序技術(shù)平臺(tái),只需幾個(gè)月就可以完成。
2. 測(cè)序的實(shí)驗(yàn)周期是多久?
答:根據(jù)具體基因組大小和復(fù)雜程度來(lái)確定完成時(shí)間,一般地從獲得樣品到高通量測(cè)序完成,細(xì)菌等小基因組需要1-2個(gè)月,其他基因組需要2-6個(gè)月。
3. DNA樣品的送樣要求如何?
答:DNA樣品總量不小于10µg,濃度≥200ng/µL,OD值在1.8-2.0之間,樣品濃度越高越好。請(qǐng)?zhí)顚?xiě)完整的送樣訂單,用自封袋密封后隨同樣品一起附干冰送樣。
4. 是否需要生物學(xué)重復(fù)?重復(fù)幾次?
答:是的,至少需要兩次生物學(xué)重復(fù),3次以上的生物學(xué)重復(fù)更好。2011年7月Hansen發(fā)表的文章表明生物學(xué)差異是基因自身表達(dá)的特性,與檢測(cè)技術(shù)的選擇以及數(shù)據(jù)處理的方式無(wú)關(guān)。如果不設(shè)生物學(xué)重復(fù),高影響因子的雜志可能會(huì)因此而拒稿。把這篇文章列在參考文獻(xiàn)里吧
5. 如何檢測(cè)基因組組裝的準(zhǔn)確性?
答:目前,主要可以通過(guò)以下幾種方法來(lái)檢驗(yàn)基因組組裝的準(zhǔn)確性。(1) 通過(guò)構(gòu)建BAC或Fosmid文庫(kù),并進(jìn)行常規(guī)測(cè)序,將所得序列與拼接好的Contigs作比對(duì)以判斷基因組組裝的準(zhǔn)確率。(2)將已知的基因序列與拼接好的Scaffold作比對(duì),查看兩者是否吻合,吻合度越高,表明基因組組裝越好。而且已知的基因序列越多,評(píng)價(jià)結(jié)果越可靠。(3)估計(jì)組裝后基因組的單堿基準(zhǔn)確度,利用新一代測(cè)序技術(shù),如果95%以上的基因組單堿基覆蓋度超過(guò)20×,則認(rèn)為該見(jiàn)機(jī)組的單堿基準(zhǔn)確度較高。
6. 如何避免基因組中的重復(fù)序列造成的組裝錯(cuò)誤?
答:應(yīng)用新一代高通量測(cè)序技術(shù),構(gòu)建200bp、500 bp、2 Kb、6 Kb、10 Kb、20 Kb等不同大小的DNA測(cè)序文庫(kù),進(jìn)行雙末端海量測(cè)序,可以避免基因組中的重復(fù)序列造成的錯(cuò)拼。當(dāng)測(cè)序數(shù)據(jù)量達(dá)到基因組大小的60倍以上時(shí),即可保證基因組的完整性和序列中單堿基的準(zhǔn)確性。
六、 相關(guān)文獻(xiàn)
1. Li R, Fan W, Tian G, Zhu H, et al The sequence and de novo assembly of the giant panda genome. Nature 2010 Jan 21; 463:311-17. Epub 2009 Dec 13
2. Genome Sequence of Staphylococcus capitis QN1, Which Causes Infective Endocarditis. J. Bacteriol. 2012, 194(16):4469. DOI: 10.1128/JB.00827-12.
電話: 021-54960912 ;54035803
試劑,耗材:802分機(jī)
儀器: 803分機(jī)
技術(shù)服務(wù): 804分機(jī)
傳真: 021-54035803-808
E-Mail:webmaster@dobio.com.cn