2023年11月9日,國家基因庫生命大數(shù)據(jù)平臺(tái)(CNGBdb)獲得CoreTrustSeal全球核心可信存儲(chǔ)庫國際認(rèn)證。CoreTrustSeal全球核心可信存儲(chǔ)庫國際認(rèn)證是由國際科學(xué)理事會(huì)數(shù)據(jù)批準(zhǔn)印章(Data Seal of Approval,DSA)和世界數(shù)據(jù)系統(tǒng)(World Data System,WDS)聯(lián)合推動(dòng)的全球核心可信存儲(chǔ)庫國際認(rèn)證。截至目前,CNGBdb是生命科學(xué)領(lǐng)域國內(nèi)首個(gè)通過該國際認(rèn)證的數(shù)據(jù)倉儲(chǔ)。
此前CNGBdb已獲得Wiley、Oxford、Cell Press、Science系列期刊等多家國際出版機(jī)構(gòu)/期刊認(rèn)可,本次通過CoreTrustSeal認(rèn)證表明CNGBdb的數(shù)據(jù)匯交、規(guī)范管理、可信存儲(chǔ)、權(quán)益保護(hù)、長(zhǎng)期保存和持續(xù)服務(wù)能力等得到國際認(rèn)可,能夠接收生命科學(xué)領(lǐng)域在國際期刊發(fā)表論文的相關(guān)科學(xué)數(shù)據(jù),是我國生命科學(xué)領(lǐng)域數(shù)據(jù)中心國際化能力提升的充分體現(xiàn)。
CoreTrustSeal數(shù)據(jù)中心認(rèn)證體系是國際科學(xué)理事會(huì)(International Scientific Coucil,簡(jiǎn)稱ISC)世界數(shù)據(jù)系統(tǒng)(World Data System,簡(jiǎn)稱WDS)于2018年推出的一套認(rèn)證系統(tǒng),是目前最新且最為人信賴的國際數(shù)據(jù)中心認(rèn)證,致力于推廣國際范圍內(nèi)可持續(xù)和可信賴的數(shù)據(jù)中心或數(shù)據(jù)存儲(chǔ)庫。其認(rèn)證過程十分嚴(yán)格,從組織基礎(chǔ)架構(gòu)、數(shù)據(jù)管理、技術(shù)能力等三大維度,對(duì)數(shù)據(jù)中心的工作使命、開發(fā)與運(yùn)維團(tuán)隊(duì)、專家團(tuán)隊(duì)、數(shù)據(jù)質(zhì)量控制、工作流程、硬件基礎(chǔ)、數(shù)據(jù)安全等16項(xiàng)要求進(jìn)行評(píng)估,這些內(nèi)容反映了可信賴數(shù)據(jù)存儲(chǔ)庫的核心特征。CoreTrustSeal數(shù)據(jù)中心認(rèn)證系統(tǒng)已成為申請(qǐng)加入WDS正式成員(Regular Member)的必要條件。CNGBdb通過的是CoreTrustSeal 2020-2023年的核心可信存儲(chǔ)庫認(rèn)證要求。
作為服務(wù)于國家戰(zhàn)略的重大科技基礎(chǔ)設(shè)施之一,深圳國家基因庫已建成千萬級(jí)樣本存儲(chǔ)能力、691萬億次/秒計(jì)算能力、Pb級(jí)數(shù)據(jù)產(chǎn)出能力,并在此基礎(chǔ)上建立了綜合性生命科學(xué)數(shù)據(jù)共享平臺(tái)——國家基因庫生命大數(shù)據(jù)平臺(tái)(CNGBdb),為全球科研工作者提供生物大數(shù)據(jù)匯交管理和共享服務(wù)。
上圖為國家基因庫生命大數(shù)據(jù)平臺(tái)(CNGBdb)
CNGBdb一直致力于穩(wěn)定、可靠、持續(xù)的科學(xué)數(shù)據(jù)存儲(chǔ)庫建設(shè),并推動(dòng)科學(xué)數(shù)據(jù)的安全共享。目前CNGBdb已通過FAIRsharing認(rèn)證及國際科研數(shù)據(jù)倉儲(chǔ)目錄re3data收錄,支持Elsevier、Wiley、Taylor & Francis、Oxford、Cell Press、Science等多個(gè)國際著名出版社/系列期刊投稿發(fā)文,交到CNGBdb的數(shù)據(jù)統(tǒng)一進(jìn)行DOI(數(shù)字對(duì)象標(biāo)識(shí)符)標(biāo)識(shí)。
CNGBdb的存儲(chǔ)功能由國家基因庫序列歸檔系統(tǒng)(CNSA)負(fù)責(zé)。CNSA是一個(gè)支撐全球組學(xué)研究成果匯交和管理的系統(tǒng),致力于多組學(xué)數(shù)據(jù)(基因組、轉(zhuǎn)錄組、代謝組、單細(xì)胞和空間轉(zhuǎn)錄組等)的開放和共享,為全球科研人員提供更加安全、穩(wěn)定、可靠、便捷的數(shù)據(jù)歸檔服務(wù),促進(jìn)多組學(xué)數(shù)據(jù)的再利用,推動(dòng)全球生命科學(xué)的發(fā)展。
上圖為國家基因庫序列歸檔系統(tǒng)(CNSA)
截至目前,CNSA已歸檔多組學(xué)數(shù)據(jù)12607TB,支撐全球近500個(gè)科研單位的科研數(shù)據(jù)匯交和共享,支持論文發(fā)表1323篇,發(fā)表期刊367種,包括The Lancet、Science、Cell等。此外,CNSA審編團(tuán)隊(duì)還定期組織數(shù)據(jù)遞交實(shí)戰(zhàn)培訓(xùn),解答用戶在數(shù)據(jù)遞交過程中遇到的常見問題,手把手教你輕松搞定數(shù)據(jù)上傳。
未來,CNGBdb將繼續(xù)在嚴(yán)格保障數(shù)據(jù)安全的前提下,持續(xù)提升數(shù)據(jù)資源建設(shè)和數(shù)據(jù)挖掘分析服務(wù)能力,為全球科研工作者提供更優(yōu)質(zhì)、可靠的科學(xué)數(shù)據(jù)服務(wù),打造良好的生命科學(xué)數(shù)據(jù)生態(tài)環(huán)境。
相關(guān)稿件