病毒不僅對(duì)人類(lèi)健康產(chǎn)生深遠(yuǎn)的影響,也是全球生物地球化學(xué)循環(huán)的幕后推手。目前大多數(shù)病毒分類(lèi)方法主要依賴于接近完整的病毒基因組數(shù)據(jù),對(duì)片段化和不完整的病毒序列分類(lèi)效果較差。此外,目前的技術(shù)手段大多對(duì)雙鏈DNA病毒的分類(lèi)效果較好,而對(duì)RNA病毒和單鏈DNA病毒的高通量準(zhǔn)確分類(lèi)仍存在困難。特別是對(duì)于高度不完整的病毒片段,如何將其準(zhǔn)確地進(jìn)行分類(lèi)仍然是一個(gè)亟須解決的問(wèn)題。
上述問(wèn)題限制了業(yè)界對(duì)環(huán)境中復(fù)雜病毒群體的深入解析。如何準(zhǔn)確細(xì)致地對(duì)環(huán)境病毒進(jìn)行分類(lèi),已成為當(dāng)今生物學(xué)、醫(yī)學(xué)與生態(tài)學(xué)研究亟待突破的重要挑戰(zhàn)。
該研究團(tuán)隊(duì)開(kāi)發(fā)的VITAP通過(guò)結(jié)合序列比對(duì)與圖論算法,不僅能對(duì)DNA及RNA病毒進(jìn)行精準(zhǔn)分類(lèi),還為每個(gè)分類(lèi)單元提供了置信度評(píng)估,可對(duì)長(zhǎng)度短至1000個(gè)堿基對(duì)的病毒基因組序列進(jìn)行從門(mén)到屬水平的高效分類(lèi),并大幅提升了病毒注釋率。
此外,VITAP能夠基于國(guó)際病毒分類(lèi)委員會(huì)(ICTV)制定的最新分類(lèi)數(shù)據(jù)庫(kù)進(jìn)行自動(dòng)更新,并支持用戶自定義分類(lèi)數(shù)據(jù)庫(kù)。
在后續(xù)的分析測(cè)試中,該研究團(tuán)隊(duì)將VITAP方法成功應(yīng)用于宏病毒組和病毒基因組的注釋?zhuān)Y(jié)果顯示VITAP在科級(jí)和屬級(jí)的分類(lèi)分析中不僅能保持超過(guò)90%的準(zhǔn)確率、精度和召回率,還顯示出了優(yōu)于其他方法的注釋率。
整體而言,VITAP在保證高準(zhǔn)確率的前提下,實(shí)現(xiàn)了更全面、穩(wěn)定的病毒分類(lèi),并為病毒基因組學(xué)、分類(lèi)學(xué)和生態(tài)學(xué)研究提供了一個(gè)高效的自動(dòng)化新工具。
關(guān)鍵詞: