Language

中研院發表生物資訊演算工具,有效提升基因體研究效率

在全球科學家持續不斷的對基因體做各種假設與求證的研究工作之際,生物資訊學也因應而蓬勃的發展。中央研究院基因體研究中心的生物資訊組研究人員最近於該領域權威的期刊Bioinformatics,發表對於基因預測與多樣切割(Alternative Splicing,簡稱AS)所發明的演算工具。

由莊樹諄博士所領導的團隊,成功的研發完成一個可以預測基因以及分析Alternative Splicing (AS)的工具-漸進式訊號擷取與補綴 (PSEP, Progressive signal extracting and patching) 演算法。這個演算法基於EST對基因體 (genome) 以及基因體對基因體的比對的結果,來預測基因與AS。

這整個系統包含兩個主要步驟:跨物種序列比對(在此主要是針對人與老鼠)以及比對結果的後處理。這個後處理包含一連串的漸進式訊號擷取與補綴動作,其在基因預測方面,成功地濾掉高達88% 可能的雜訊。在整體的精確度比較上,以三個公認的標準測試資料組:ELN基因區域、HoxA叢集、ROSETTA基因組來測試,得到精準度極高的確認。現有知名的跨物種基因預測程式,如ROSETA程式、TWINSCAN、SGP-1/-2、以及SLAM等,均無法比擬。

除了基因預測外,PSEP 更同時具備了AS預測與分析的能力,這也是上述其他既有方法所沒有的。由於PSEP具備跨物種的序列保留分析以及AS分析的功能,PSEP非常適合應用於 AS式樣在演化上的研究以及尋找未定義的基因表現特徵。此篇研究成果已獲期刊Bioinformatics所刊登(Chuang, T.-J.*, Chen, F.-C., and Chou, M.-Y. (2004) “A comparative method for identification of gene structures and alternatively spliced variants”, Bioinformatics 20: 3064-3079.)。

此外,研究小組也將這個方法延伸應用於更多物種間的研究,並建立一個入口網站-ESTviewer供全球有興趣的研究者使用。目前該網站上提供的研究物種除了人之外還包括小鼠、大鼠、牛、豬、雞等,其網址為http://www.sinica.edu.tw/~trees/ESTviewer/ESTviewer.htm.

論文集