張弓課題組聯合承啟生物在Nucleic Acids Research發表最強翻譯組學數據庫
2017-11
文章來自:admin 閱讀次數:4158
我院張弓教授課題組與深圳承啟生物科技有限公司近日在核酸領域的頂級專業期刊Nucleic Acids Research(IF=10.16)聯合發表了目前最強的翻譯組學數據庫,繼續保持其在翻譯組學方面的國際領先地位。
翻譯組學是一門新興學科,研究mRNA到蛋白質的翻譯過程中的總體。該學科由我院張弓教授創立,其課題組開發了翻譯組學中幾乎所有的技術。其中,從總體上測定正在翻譯的mRNA是翻譯組學中最重要的研究内容之一,技術手段包括RNC-seq和Ribo-seq兩種大規模測序方法,在生物學的方方面面幾乎都有重要的應用,也是人類蛋白質組計劃的核心支柱之一。但此類實驗極其難做,世界上能開展此類研究的實驗室極少,因此充分利用現有的翻譯組測序數據進行挖掘就成為了世界生物學界十分現實的需求。然而現有數據集十分分散,查找和對比不易,而且各課題組的材料、測序方法、分析方法等都有很大差别,得出的數據無法直接比較。生物學科研人員一般不具有分析海量的測序原始數據的能力和條件,更加制約了對現有數據的利用。
張弓教授課題組針對以上問題,開發了TranslatomeDB(翻譯組學數據庫http://www.translatomedb.net/),收集了迄今為止13個物種的3857個翻譯組學相關測序數據集,是目前最為全面的翻譯組學數據庫。各種檢索和對比隻需要動動鼠标即可輕松完成。
該數據庫的強大之處遠不止于此,還在于利用超高精度的FANSe3代算法對所有數據集進行統一的高精度、高容錯的分析。盡管各數據集使用的儀器不同、測序設置不同,但都可以放到一起來比較。由張弓教授開發的FANSe系列算法是目前世界上精度最高、穩健性最強的大規模測序快速比對算法,其實驗驗證率接近100%,在多個臨床緊急案例中發揮重要作用,張弓教授也因此被邀請做TED演講。FANSe3是FANSe系列的第三代算法,是深圳承啟生物科技有限公司的橫向研發項目,其準确度不遜色于前代,而速度卻提升30多倍。依托于承啟生物所建立的商業化測序分析雲平台Chi-Cloud(http://www.chi-biotech.com/index.php/fenxi),3857個數據集隻用了一個多小時便全部分析完成,平均每個數據集分析時間僅1秒多。
更厲害的是,TranslatomeDB還允許用戶上傳自己的測序數據集(包括RNC-seq,Ribo-seq和相應的mRNA-seq),和數據庫中已收錄的大量數據進行統一分析,簡單快捷、傻瓜式操作,無需占用任何本地計算資源,也不需要用戶具備高深的生物信息學技能。這一切都是免費的,所有的計算資源均由深圳承啟生物科技有限公司無償捐贈。
數據庫的建立、維護及與Chi-Cloud雲平台對接的工作,由承啟生物的專業IT團隊完成。正是有了公司的強大IT團隊的努力和強大的Chi-Cloud雲平台支持,TranslatomeDB從開始研發到投稿僅用時不到半年,良好的校企聯合是其快速突破專業頂級期刊的保障。TranslatomeDB數據庫一經發表便得到了Nucleic Acids Research編輯的高度贊賞,審稿過程也極為順利。一位審稿人對TranslatomeDB的審稿評價僅一句話:“ I believe this resource will be very useful for many scientists”(我相信這個資源将對許多科學家非常有用)!
我院助理研究員劉婉婷博士、本科生鄭廷锴、承啟生物程序員向倫平為共同第一作者,張弓教授為通訊作者。主要經費來自于承啟生物的橫向研發項目。
Functional flow chart of TranslatomeDB
文章鍊接:
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkx1034/4584635