轉錄因子數據庫及使用方法介紹——AnimalTFDB v4.0
什么是轉錄因子:在分子生物學中,轉錄因子(英語:Transcription factor,縮寫為TF)是指能夠結合在某基因上游特異核苷酸序列上的蛋白質[1][2];它包含一個或多個DNA結合域(DNA-binding domain, DBDs)。
轉錄因子的作用:轉錄因子一般有不同的功能區域,如DNA結合結構域與效應結構域。轉錄因子不單與基因上游的啟動子區域結合,也可以和其它轉錄因子形成轉錄因子復合體來影響基因的轉錄,可以產生很復雜而精細的影響。結合在DNA上的啟動子以及增強子之類控制轉錄的區域上,促進或者抑制DNA上的遺傳信息向RNA轉錄的過程。轉錄因子的這一機能可以單獨,或者通過與其它蛋白質形成復合體來完成。
目前已經有比較完備的數據庫用于輔助研究轉錄因子,今天跟大家介紹一個使用較為廣泛的動物轉錄因子數據庫:AnimalTFDB。
AnimalTFDB是第一個最全面的動物轉錄因子數據庫(http://bioinfo.life.hust.edu.cn/AnimalTFDB4/#/),其中包括183個動物全基因組轉錄因子 (TF) 和轉錄輔助因子(transcription cofactors)的分類和注釋。
從2011年發布至2022年更新至v4.0,期間一直持續更新。在最新版本v4.0中,有27萬個 TF 并根據 DNA 結合域(DBD)分為73個家族和6個類別。同時還有15萬個轉錄輔助因子,分為82個家族和6個類別。
圖1 AnimalTFDB簡介及其工作流
如何通過AnimalTFDB進行轉錄因子相關分析:
1
Family
(http://bioinfo.life.hust.edu.cn/AnimalTFDB4/#/Family)
以類別和家族對轉錄因子/轉錄輔助因子進行分類(圖2),可以查看特定家族的轉錄因子信息;介紹了各個轉錄家族的詳細信息,文獻來源及在各物種中的分布情況(圖3)。
圖2 Family界面
圖3 TF family: AP-2 界面
2
Search
(http://bioinfo.life.hust.edu.cn/AnimalTFDB4/#/Search)
首頁上的搜索框及上方導航欄中的Search按鈕都可以使用Ensembl ID、Entrez ID或Gene Symbol等進行檢索;此外搜索界面可以根據mRNA/protein表達水平(僅包含人,收錄了TCGA, GTEX,EBI Cellline數據庫的信息)進行檢索(圖4)。
圖4 高級搜索界面
3
轉錄因子預測
(http://bioinfo.life.hust.edu.cn/AnimalTFDB4/#/TF_Predict)
Predict TF:可以對蛋白序列進行轉錄因子預測,在Input中輸入fasta格式的蛋白序列即可預測(圖5);最多可同時輸入1000個蛋白序列進行預測;
圖5 Predict TF界面(*雖然該界面上標注為至多10000個蛋白序列,實際上只允許1000個蛋白序列同時預測)
4
轉錄因子結合位點預測
(http://bioinfo.life.hust.edu.cn/AnimalTFDB4/#/TFBS_Predict)
基于核酸序列預測可結合的轉錄因子及位點;整合了TRANSFAC,JASPAR,HOCOMOCO,CIS-BP和hTFtarget數據庫的TF motif矩陣,用MEME (http://meme-suite.org/index.html)進行TF預測(圖6)。
圖6 Predict TFBS,輸入fasta格式核酸序列預測可結合的TF,結果可以導出
5
Blast
(http://bioinfo.life.hust.edu.cn/AnimalTFDB4/#/Blast)
可使用蛋白/核酸序列在數據庫中搜索轉錄因子,來找到其同源基因和研究不多的轉錄因子的功能(圖7);
可以選擇所有物種或特定物種的蛋白序列作為BLAST的比對數據庫。
圖7 Blast比對
AnimalTFDB v4.0數據庫結合歐易轉錄組分析結果使用:對于該網站包含的物種(可通過首頁的TF species下載檢索),可以基于我們常規分析結果中的基因id/序列在線預測/檢索該基因的TF和TFBS,之后通過歐易云平臺中的網絡圖交互工具(https://cloud.oebiotech.cn/task/detail/interactive_network/)構建gene和TF之間的調控網絡。
以上就是AnimalTFDB v4.0數據庫的介紹以及相關使用方法,后續我們會再對植物相關的TF數據庫PlantTFDB(http://planttfdb.gao-lab.org/)進行介紹,敬請期待~
參考文獻:
[1]. Latchman DS. Transcription factors: an overview. The International Journal of Biochemistry & Cell Biology. December 1997, 29 (12): 305-12.
[2]. Karin M. Too many transcription factors: positive and negative interactions. The New Biologist. February 1990, 2 (2): 126-31.
上海歐易生物醫學科技有限公司(簡稱:“歐易生物”),成立于2009年,經過十多年穩健發展,已經成長為擁有“晶準生物”“鹿明生物”“青島歐易”三家全資子公司,近600名員工的生物科技領域集團型企業。
歐易生物始終秉持著“硬數據 · 好服務”的理念服務于大眾。為大生命科學、大健康相關研究領域,以及醫藥、食品及日化企業的客戶,提供從基礎研究到藥物靶點發現、藥理藥效及安全性評價、疾病分子標志物篩選、致病菌及耐藥菌溯源等相關技術服務,全力加速客戶研究與開發進程,提升客戶研究與開發價值。
歐易生物攜手旗下子公司,實現了中心法則上、中、下游多層組學的串聯,從基因組、轉錄組、表觀組、微生物組,到蛋白組、代謝組及近年熱門的單細胞&空間多組學技術服務,為科研用戶提供全面的創新多組學技術服務。
歐易生物已先后獲得上海市科技小巨人企業、閔行區研發機構、閔行區企業技術中心、產權管理體系認證企業等資質。擁有授權發明專利30+項,在受理發明專利50+項,軟件著作權150+項。