干貨分享:蛋白組學(xué)原始數(shù)據(jù)如何上傳?
近期有不少客戶咨詢和反饋,說發(fā)文章的時候,蛋白組學(xué)的原始數(shù)據(jù)該如何上傳?上傳到什么平臺呢?
那么今天我們就一起來細數(shù)目前主流的蛋白組學(xué)原始數(shù)據(jù)上傳平臺,并提供具體的上傳路徑供各位老師參考。
? 概述??
我們先說說為什么要上傳蛋白組學(xué)原始數(shù)據(jù)到公共平臺。一是方便學(xué)術(shù)界進行數(shù)據(jù)成果的存儲和共享;二是投稿的時候不需要單獨再上傳海量數(shù)據(jù)給期刊,文章中標(biāo)注在公共平臺的數(shù)據(jù)項目ID就行。因此,選擇一個公認和可靠的數(shù)據(jù)公共平臺是非常有必要的。
目前,最主流的蛋白組學(xué)數(shù)據(jù)公共平臺是?ProteomeXchange,是European Molecular Biology Laboratory(EMBL)旗下的一個專門儲存蛋白組數(shù)據(jù)的公共平臺,也是目前收錄蛋白組數(shù)據(jù)集最多的平臺。同時,為了國際間蛋白組數(shù)據(jù)的更好共享,ProteomeXchange?聯(lián)盟吸納了全球多個蛋白組學(xué)數(shù)據(jù)存儲和共享平臺(圖1),目前包括:PRIDE(EMBL-EBI,劍橋,英國),PeptideAtlas(ISB,西雅圖,華盛頓州,美國),MassIVE(UCSD,圣地亞哥,加利福尼亞州,美國),jPOST(多機構(gòu),日本),iProX(國家蛋白質(zhì)科學(xué)中心,北京,中國)和?Panorama Public(華盛頓大學(xué),西雅圖,華盛頓州,美國)”。
圖1. ProteomeXchange 聯(lián)盟成員全球分布圖
那么,這么多數(shù)據(jù)公共平臺該如何選擇呢?
目前國際上用的比較多的是 PRIDE。但近年來大家都知道如果涉及人類遺傳學(xué)數(shù)據(jù)是不允許上傳到國外平臺的,那么 iProX 則是國內(nèi)學(xué)者最好的選擇。iProX 是中國的綜合性蛋白質(zhì)組資源中心,提交系統(tǒng)是在 ProteomeXchange 聯(lián)盟制定的數(shù)據(jù)共享政策的指導(dǎo)下建立的,因此國際上也是非常認可的。我們從下圖 iProX 網(wǎng)站的統(tǒng)計數(shù)據(jù)可以看到目前平臺收錄的數(shù)據(jù)集已經(jīng)比較多了。同時,iProX 網(wǎng)站可進行中英文雙語切換,加上服務(wù)器在國內(nèi),上傳速度比較快,非常適合國內(nèi)學(xué)者。接下來我們一起看下利用 iProX 進行蛋白組原始數(shù)據(jù)提交的詳細流程。
圖2. iProX 網(wǎng)站主頁界面
?iProx 數(shù)據(jù)提交流程?
Step.1
注冊賬號并創(chuàng)建項目
注冊賬號并通過郵件激活后,我們可以
圖3. iProX 網(wǎng)頁主菜單界面
Step.2
項目信息填寫
進入創(chuàng)建項目窗口后,根據(jù)指引填寫項目相關(guān)信息。這里有一個需要注意的地方是,訪問權(quán)限的下拉菜單可以選擇三種方式。
Public:即刻就公開;
To be public:自定義公開的時間;
Private:暫不公開。
不過,當(dāng)你的文章發(fā)表后,該項目的數(shù)據(jù)會自動面向公眾發(fā)布。
圖4. iProX 網(wǎng)頁中數(shù)據(jù)公開形式的選擇界面
Step.3
子項目信息填寫
子項目信息填寫的內(nèi)容主要針對具體蛋白組學(xué)實驗中的一些信息,如物種類型、組織類型、疾病類型、定量方法、使用的質(zhì)譜儀器等。這里按照項目的實際情況填寫就可以。
Step.4
數(shù)據(jù)上傳和提交
(1)iProX目前提供兩種數(shù)據(jù)提交的形式:Complete submission(完整提交)和Partial submission (部分提交)。Complete submission對提交的數(shù)據(jù)格式有要求,Partial submission則適合所有的數(shù)據(jù)上傳,不過Partial submission由于數(shù)據(jù)格式的問題會明顯降低數(shù)據(jù)的可見度和重復(fù)利用度。
表1. iProX 數(shù)據(jù)提交方式和文件格式要求
數(shù)據(jù)提交形式
文件類型
文件格式
Complete submission
RESULT
prideXML、mzldentML(需要有對應(yīng)的 PEAK 文件)
RAW
質(zhì)譜儀產(chǎn)出的原始文件
Partial submission
SEARCH
搜索得到的結(jié)果文件
RAW
質(zhì)譜儀器產(chǎn)生的原始文件
說明:如果選擇?Complete submission,RESULT 文件中必須有 prideXML 或 mzldentML 中的一種,并且如果是 mzldentML 文件還需要有對應(yīng)的 PEAK 文件。
(2)iProX上傳的方式有網(wǎng)頁上傳(Uploud by Browse)和Aspera插件上傳(Upload by Aspera)兩種。網(wǎng)頁上傳文件大小不能超過4Gb,因此更多的情況下都是通過 Aspera 上傳數(shù)據(jù)文件。
選擇好數(shù)據(jù)提交的形式和上傳方式后,
圖5. iProX 數(shù)據(jù)上傳界面
Step.5
附件信息
表2. ProteomeXchange 資源的提交指南摘要以及所涉及的提交類型
如果想進一步了解或使用相關(guān)數(shù)據(jù)庫平臺,可以訪問相關(guān)網(wǎng)站:
iProX:?http://www.iprox.org/;
ProteomeXchange:?http://www.proteomexchange.org;
PRIDE:?http://www.ebi.ac.uk/pride;
PeptideAtlas:?http://www.peptideatlas.org/;
PASSEL:?http://www.peptideatlas.org/passel/;
MassIVE:?https://massive.ucsd.edu/;
jPOST:?https://jpostdb.org/;
Panorama Public:?https://panoramaweb.org/public.url。
整體來說,蛋白組學(xué)原始數(shù)據(jù)上傳還是很便捷的。感謝這些平臺給大家提供了這樣的數(shù)據(jù)存儲和交流的方式。
西湖歐米科研服務(wù)
新品來襲 |?ProteomEx空間蛋白質(zhì)組學(xué)
特色膨脹水凝膠特色,以小見大,解析組織異質(zhì)性
新品發(fā)布 | 基于“膨脹”的空間蛋白質(zhì)組學(xué)ProteomEx服務(wù)
新品來襲 |?宏蛋白質(zhì)組學(xué)
大批量樣本處理優(yōu)勢,千人以上隊列研究,自主創(chuàng)新高通量流程
宏蛋白新品發(fā)布 | 當(dāng)“宏”流量解析“微”社區(qū)密碼
超高深度 |?TMT蛋白質(zhì)組
30Fraction高深度鑒定,優(yōu)異批次效應(yīng)處理
獨家專利 | Pulse-DIA蛋白質(zhì)組
脈沖式方法改進,鑒定量提升優(yōu)異
高深度 | DIA蛋白質(zhì)組
高性價比,高穩(wěn)定性,高靈敏度
高深度 |?4D-DIA蛋白質(zhì)組
超微量樣本,高靈敏度
其他科研服務(wù)成果介紹:西湖歐米合作文章集錦
西湖歐米創(chuàng)立于2020年7月,是一家專注于AI賦能的蛋白質(zhì)組大數(shù)據(jù)公司。我們致力于以技術(shù)創(chuàng)新為驅(qū)動力,以多模態(tài)大數(shù)據(jù)為基礎(chǔ),使用AI賦能微量臨床樣本的高通量蛋白質(zhì)組分析等組學(xué)技術(shù)輔助精準(zhǔn)醫(yī)學(xué)和藥物研發(fā)。西湖歐米擁有一支專業(yè)的團隊,有豐富的項目經(jīng)驗,為您的樣本保駕護航。
如有意向,歡迎咨詢
聯(lián)系我們 CONTACT US:
郵箱:service@westlakeomics.com
座機:0571-86780630