聯系我們contact

電(diàn)話(huà):027-59760188-801

地(dì)址:武漢市(shì)東(dōng)湖(hú)高(gāo)新開(kāi)發區$✔" (qū)光(guāng)谷大(dà)道(dào)120号現(∏€₩<xiàn)代森(sēn)林(lín)小(xiǎo)鎮A座609室

一(yī)款開(kāi)源的(de)系統生(shēng)物(wù≥​ ✔)研究數(shù)據管理(lǐ)系統&mda☆↕¶₹sh;—OpenBIS

發布時(shí)間(jiān):2018->ε♦07-09 浏覽次數(shù):1756次

一(yī)、前言導讀(dú)

今天給大(dà)家(jiā)介紹一(yī)款開(kāi)源的(de)專門≈λ(mén)管理(lǐ)生(shēng)物(wù)學研究數≠$§(shù)據的(de)管理(lǐ)軟件(jiànε✘)openBIS,文(wén)章(zhān$≠g)分(fēn)為(wèi)兩個(gè)部♠​←™分(fēn),前一(yī)部分(fēn)介紹軟件(jiàε♥§↔n)的(de)一(yī)些(xiē)基本特性和(héπ₽☆π)概念,後一(yī)部分(fēn)介紹軟件(jiàn)在一(÷σyī)些(xiē)領域中的(de)具體(tǐ)應用↓ε≠(yòng)。

OpenBIS當前已經在多(duō)個(gè)SystemX.c♦₩β‌h 和(hé)歐盟項目(應用(yòng)質譜技(jì)術(shù)研究代謝(×× "xiè)物(wù)和(hé)蛋白(bái)↑→€↓質,高(gāo)內(nèi)涵篩選,下(xià)一(yī)代的(de)基$¥因測序技(jì)術(shù)。)得(de)到(dào)了(le)非常成功的(d↑​e)應用(yòng)。對(duì)于涉及α‌大(dà)型的(de)系統生(shēng)物(wù)學研究群體(↑₩¥>tǐ)來(lái)說(shuō),OpenBIS是(shì)極其合适的(de)♠<'♠,其功能(néng)豐富,系統靈活,部署簡單,可(kě)擴展性強,适合管理(l∑×♥ǐ)組學研究等龐大(dà)的(de)數(shù)據,并且能(né↕‌ng)夠處理(lǐ)幾乎任何種類的(de)生(shēng)物(wù)學數(sh α​εù)據類型,甚至可(kě)以擴展到(dào)其他(tā)研究領域。

不(bù)管是(shì)系統生(shēng)物(wù)學,還(hái)‌→¶是(shì)組學,随著(zhe)儀器(qì)₩±↔≈技(jì)術(shù)的(de)進步,這(zhè)些(xiē)∏βπ新興學科(kē)的(de)研究方式與方法都(d£≠αōu)對(duì)生(shēng)物(wù)實£©驗數(shù)據的(de)管理(lǐ)和↑✘(hé)高(gāo)性能(néng)計(jì)算(su'​‍♥àn)提出了(le)前所未有(yǒu)的(de)挑戰。系統×λφ↔生(shēng)物(wù)學,基因組學、蛋白($§bái)質組學、代謝(xiè)組學等大(dà)科(kē)學工(α‍gōng)程往往意味著(zhe)項目的(de€✘)長(cháng)期持續,參與單位和(hé)人(r∏•én)員(yuán)衆多(duō),産生(shēng)的(de)數(shù)§§ 據量十分(fēn)龐大(dà)和(hé)複雜(zá),并且♥₽要(yào)綜合生(shēng)物(wù)信息學、計← "(jì)算(suàn)機(jī)科(kē)學、數(shù)學等多(d≥π≥uō)學科(kē)的(de)力量協作(zuò) ≠♣‌完成。大(dà)科(kē)學工(gōng)程的(de)‍£•♥長(cháng)期性與複雜(zá)性要(yào)求‌σ★一(yī)套系統能(néng)應對(duì)種類繁多(duō)且÷↕♥¥體(tǐ)量龐大(dà)的(de)原始數(shù)據存儲,研究過程的β®(de)靈活多(duō)變,數(shù)₹δ據分(fēn)析工(gōng)具與算(suàn)法的(≠₽ de)不(bù)斷更新,研究團隊人(rén)員(yuán)變動等一•Ω(yī)系列問(wèn)題。    生(sδ← ¥hēng)物(wù)實驗數(shù)據管理♠ (lǐ)系統需要(yào)提供一(yī)個(gè)堅實的(de)基礎平台φ¥φ 用(yòng)于存儲種類繁多(duō)且體(tǐ)量龐大(dà)   的(de)分(fēn)析儀器(qì)數(shù)據并★←σ≠能(néng)快(kuài)速整合各種數(shù)據分(fēn)析流程©™Ω≠,包括商業(yè)的(de)數(shù)據流程化(huà)處理(lǐ)軟♠ γ件(jiàn)和(hé)研究人(rén)員(yuán)自(↓✘®φzì)己開(kāi)發的(de)數(shù)據分(fēn)析方≤§↑ 法。不(bù)同品牌、不(bù)同型号的(de)儀器(qì)原φ☆始數(shù)據和(hé)不(bù)同方式的(de)數(shù)據"Ω&分(fēn)析方法所産生(shēng)的(de)結果數(‍ φ™shù)據都(dōu)需要(yào)長(cháng)久保存,以備将來(lái)♦α★再次引用(yòng)以及曆史數(shù)據的(de)比較和(hé)整合。在這(&‍←‌zhè)期間(jiān),數(shù)據的(de€λ‌¥)格式與存儲方式也(yě)會(huì)随著(z≤☆<∞he)數(shù)據分(fēn)析技(jì)術✔£(shù)和(hé)相(xiàng)關标準的(de)發展而逐步發生("£shēng)變化(huà)。這(zhè)些(xiē)數(shù)據α↑在相(xiàng)當長(cháng)的(de)一(yī×γ )段時(shí)間(jiān)內(nèi)都(dōu)可(kě)能(∞$néng)被各類數(shù)據分(fēn)析人(rén ≥)員(yuán)進行(xíng)分(fēn)析和≤®(hé)重新分(fēn)析。作(zuò)為(wèi)儀器( ♠qì)分(fēn)析原始數(shù)據和(hé)數(shù)據分(fēn)析∏<→§所産生(shēng)的(de)結果數(shù)據的(de)倉庫,承擔著(zh ↑e)為(wèi)各種功能(néng)各異的(de)分(fēn)析組件(jià↕±n)提供數(shù)據來(lái)源以及作(zuò)為(wèi)不(b±≈σγù)同階段不(bù)同數(shù)據處理(lǐ)工(gōnσσg)作(zuò)流之間(jiān)溝通(tōng)的(de)橋梁。≤♠∞​

我們可(kě)以設想,解決如(rú)此複雜(z≈α×βá)問(wèn)題的(de)的(de)軟件(jiàn)肯定不(bù)是(s↑∞ €hì)一(yī)個(gè)剛性的(de)框£'φε架,而是(shì)模塊化(huà)的(de),松散耦合↔♥≈的(de),這(zhè)些(xiē)模塊分(fēn)别實現↔♥δ(xiàn)某個(gè)特定的(de)功能(néng)→&↕♥或者提供特定的(de)服務,而不(bù)苛求單一(yī)模↑♦♦>塊或服務滿足所有(yǒu)需求。同硬件(Ω​≠§jiàn)一(yī)樣,這(zhè)些(xi÷∏ē)模塊應該是(shì)即插即用(yòng)型的(de),能(néng)很(h∑☆∏ ěn)方便地(dì)整合進體(tǐ)系中。模塊之間(jiā εn)也(yě)能(néng)方便地(dì)相(xiàng)互整合,并€Ω對(duì)外(wài)提供接口。同時(shí),基礎科(kē)學研究過程的↑®(de)多(duō)變性和(hé)框架松散耦合的(×φλde)特點,我們很(hěn)難設定一(yī)個(gè♠™ )标準的(de)組件(jiàn)模型,因此組件(jiàn)的(de)開(kāi≤✔)發應該著(zhe)重于整合的(de)簡便性上(sλ✔×δhàng)。

最初,OpenBIS系統設計(jì)目标就(jiù←ε )是(shì)建立一(yī)個(gè)用(yòng₩♦€​)于系統生(shēng)物(wù)學和(hé)各種組學(蛋Ω'白(bái)質組學、基因組學、代謝(xiè)♣ 組學)研究的(de)數(shù)據的(de)工(gō' "ng)作(zuò)平台,将來(lái)源于質譜,測序儀、顯微(wēi)鏡等各✔π種儀器(qì)的(de)數(shù)據進行(xíng)統一(y"λī)的(de)管理(lǐ),并從(cóng)儀器(qì)原始數(shù)據♥φφ'中提取基礎數(shù)據和(hé)元數(shù)據,與數(sh↓∞ù)據流程化(huà)處理(lǐ)工(gōnβσ≈<g)具以及各種可(kě)視(shì)化(huà)↑☆ 工(gōng)具、數(shù)據分(fēn)析工(gōn $≥✔g)具整合,對(duì)數(shù)據進行(xíng)分(fēn)階段的(de®φ☆)以及多(duō)樣化(huà)的(de)後處理(→‌✔lǐ)。在開(kāi)放(fàng)性與靈活性方'£面,不(bù)同類型的(de)用(yòng)戶與®♠$¥系統之間(jiān)采取不(bù)同的(dΩ←☆±e)交互方式訪問(wèn)原始數(shù)據÷&ε和(hé)後處理(lǐ)的(de)數(shù)據,追溯數(s →hù)據的(de)起源,而不(bù)依賴于原有(yǒu)的(dα →e)儀器(qì)和(hé)軟件(jiàn)供應商 §。系統可(kě)擴展性強,存儲和(hé)訪問(wèn)大(dà)容量數(shù∞∞♥)據,并可(kě)配置為(wèi)分(fēn)布式存儲。

 二、系統的(de)數(shù)據存儲結構    

openBIS 采用(yòngπ )邏輯層級式結構存儲數(shù)據。其管理(lǐ)的(de)層★≠¶級單元從(cóng)上(shàng)至下(xià)依次為(wèi):

 •  數(shù)據空®β(kōng)間(jiān)

 •  項目

 •  實驗

 •  樣品

 •  數(shù)據集β↕©

權限規則應用(yòng)于最高(gāo)層級之上(shàng),也(yě)α→∏就(jiù)是(shì)數(shù)據空(kōng)間(jiān)。可(k→γ₩ě)以配置訪問(wèn)規則:各終端用(yòng)于能(né®₩₩ng)看(kàn)什(shén)麽,以及πβ能(néng)夠執行(xíng)何種操作(zuò)。

層級單元之間(jiān)的(de)邏輯關系如(rú)下☆>(xià):數(shù)據空(kōng)間(jiā↔λ£n)包含一(yī)個(gè)或多(duō)個(gè)項目,項目≥$包含一(yī)個(gè)或多(duō)個(g↓✔✘$è)實驗,而實驗包含一(yī)個(gè)或多(duō)個(gè)​₩✔樣品,一(yī)個(gè)樣品可(kě)以包含一(yī)個(g✔≠è)或多(duō)個(gè)數(shù)據集。這(zh®←&è)裡(lǐ)的(de)數(shù)據集是(shε↑↓£ì)指一(yī)組包含實際分(fēn)析數(shε​ù)據和(hé)其衍生(shēng)數(sh♣ ù)據的(de)多(duō)個(gè)文δ§§(wén)件(jiàn)。例如(rú)一(yī)個(gè)✔®樣品在微(wēi)量滴定闆上(shàng)被顯微(wēi)鏡讀(d×"ú)取了(le)兩次,那(nà)麽就(jiù)會(huì)×δ産生(shēng)兩個(gè)數(shù)據集,這(zhè≥'₹)兩個(gè)數(shù)據集都(dōu)屬于 ≤該樣品。采用(yòng)這(zhè)種邏輯π&​結構十分(fēn)符合生(shēng)物(wù)學研究中的(de)♥Ω>實際情況。

采用(yòng)層級結構能(néng)夠為(wèi)存儲更™✘¥→多(duō)更大(dà)的(de)數(sh $εù)據集并建立彼此之間(jiān)的(d≈↓e)相(xiàng)互關系提供了(le)便利。例如(rú),原™↑‍始數(shù)據和(hé)處理(lǐ)後數(shù)據可(kě)以分↑₽α"(fēn)别存儲為(wèi)兩個(gè)獨立¥π'的(de)數(shù)據集,這(zhè)兩者之間(jiān)還(φ‌hái)能(néng)建立聯系(某結果數(shù)據集來(l↑γεái)源于某個(gè)原始數(shù)據集♦ ‌),并同時(shí)指向一(yī)個(gè)樣品或一(≈←™yī)個(gè)實驗。層級關系進一(yī)步衍生 εΩ≥(shēng)可(kě)以建立樣品和(hé)數(sh ‍≤↔ù)據集之間(jiān)的(de)父子(zǐ)關 §✘系,而這(zhè)在複雜(zá)的(de)科(kē)學研究™©中是(shì)經常遇到(dào)的(de)。


一(yī)款開(kāi)源的(de)系統生(shēng)物(wù)研究數(shù)據管理(lǐ)系統——OpenBIS

元數(shù)據是(shì)關于數(shù)據的(de•$☆±)數(shù)據,為(wèi)了(le)描述∏←數(shù)據在背景環境中的(de)結構和(hé)意義,便于查找和(hé← )使用(yòng)采集的(de)數(shù)據失去(q♦ε ù)了(le)元數(shù)據的(de)數(shù)據沒有(yǒu)什×​±(shén)麽意義。對(duì)元數(shù)♥§≠據的(de)管理(lǐ)是(shì)openBIS 十分(fēn)重要(yào≠<)的(de)功能(néng)之一(yī)。 

openBIS提供了(le)十分(fēn)靈活的(de)∏≥←元數(shù)據定義功能(néng),可(kě)以在數(shù)據集、樣品、Ωα☆實驗等多(duō)層次上(shàng)定義結構化(huà)、半結構化(hπ♦uà)、以及非結構化(huà)的(de)元數(shù)據,為(wèi)≈±☆靈活的(de)檢索提供保證。為(wèi)了(le)組♠←δ織這(zhè)些(xiē)元數(shù)據,×♣φ系統定義了(le)元數(shù)據類型這(zhè)個(gè)标¥ 識,用(yòng)于将創建的(de)元數(sh<λוù)據歸屬到(dào)具體(tǐ)的(de)系統對∏δ(duì)象上(shàng)(數(shù)據集、樣品§π♦、實驗)

結構化(huà)與半結構化(huà)的(de)元數(shù)據,或者叫屬性(或✔∞β者注釋),屬性就(jiù)是(shì)一(δσ₩yī)個(gè)數(shù)據庫中的(de)字段,↑<®包括名稱,标簽,描述和(hé)值類型(整數(shù)型,浮點型,σ→ 日(rì)期型,邏輯型,文(wén)本型,超鏈接,或者之前定義的(d" →§e)受控詞彙表,或者對(duì)于半結構化(huà)的(de)元數(s​¶hù)據而言可(kě)以采用(yòng)XML結構文(wén)件(jiàn)作÷∑Ω(zuò)為(wèi)存儲值)。系統允許對π÷®(duì)實驗,樣品,數(shù)據集自(zì)定♣"義屬性,并通(tōng)過屬性類型歸屬到(dào)具體(tǐ)的(de)數(≥∑↑βshù)據對(duì)象上(shàng),這•λ(zhè)些(xiē)屬性類型透明(míng)化(huà)地(dì×↑)存儲在數(shù)據庫中。openBIS中的(de)屬性還(hái)可(k$$≈ě)以是(shì)動态賦值的(de),可(kě)以根據其他(tā)β♦'元數(shù)據通(tōng)過腳本進行(xí ↕ng)賦值。

在openBIS中,用(yòng)戶可(kě)以對(duì)×δ♦€項目、實驗、樣品三者賦予非結構化(huà)的(de)元數(shù)據, ∞∞也(yě)就(jiù)是(shì)文(wé¥↔★←n)件(jiàn)型的(de)附件(jiàn),就(jiù)如(✔✘λ♥rú)同你(nǐ)在email中插入一(yī)個(gè)附件(jiàn↔ )。

基于這(zhè)種靈活的(de)自(zì)定義元數(shù→≈±)據的(de)機(jī)制(zhì),openBIS提供了(le)通(tōng✔ ≈×)用(yòng)型的(de)方式為(wèi)那(nà♥™)些(xiē)創新的(de)具備開(kāi)創性的(de)實驗建立全→β£€新的(de)元數(shù)據模型

為(wèi)了(le)高(gāo)效地(dì)存儲和(hé)±σ÷檢索系統生(shēng)物(wù)學研究中産生(shēng)的(de↔÷€™)海(hǎi)量數(shù)據,并能(néng)兼容不(bù)同的(de)分λ♠(fēn)析測試技(jì)術(shù),↕↕πopenBIS采用(yòng)混合式的(de)數(shù)據存儲方 ≠法。索引數(shù)據,實驗相(xiàng)關的(de)元數(shù↔ φ↕)據,選擇性的(de)結果數(shù)據采用(yòng)關系數(shù)據庫≤‌Ω 存儲(當然,文(wén)件(jiàn)型的≤♣♠(de)元數(shù)據也(yě)可(kě)選擇存儲到(dகo)關系數(shù)據庫中),大(dà)體(tǐ€π✘♥)積數(shù)據則采用(yòng)扁平≥≠±•化(huà)的(de)文(wén)件(jiàn)存儲(flatfile).默≥"認情況下(xià),原始數(shù)據和(hé)結果數(shù)據存λ₩‌₽儲在數(shù)據存儲區(qū)中(data store),這(zhè)α♥<•是(shì)一(yī)個(gè)由單個(gè)文(wén)件(jià§'©$n)系統或多(duō)文(wén)件(jiàn)系統(采用(€₽yòng)分(fēn)段存儲模式)組成的(de)扁平的(de)文(wén)件★§♦σ(jiàn)型數(shù)據存儲體(tǐ)系。

混合式的(de)數(shù)據存儲為(wè≤♥i)openBIS帶來(lái)了(le)靈活性和(hé)可(kě)擴展性α 。系統在數(shù)據庫中巧妙地(dì)存儲了(le)元數(shù)λ♥₽®據模型,我們可(kě)以認為(wèi)這(zhè)些(xiē)元數(shù)Ω♣↔€據模型本身(shēn)就(jiù)是(shì)系統數(↑∑shù)據的(de)一(yī)部分(fēn)。這(zhè)‍✘'≠樣,用(yòng)戶可(kě)以因地(dì)制<≈↑(zhì)宜地(dì)為(wèi)自(zì)己的(de)研究數(shù) σ↑據選擇合适的(de)元數(shù)據模型,判斷的(de)£±γ®标準可(kě)以看(kàn)元數(shù)據模型是(shì)否完整地(dì)&γ包含了(le)原始數(shù)據文(wén$≈)件(jiàn)的(de)上(shàng)≈♠≤¶下(xià)文(wén)信息,是(shì)否采用(yòng)了(le)合适的• β£(de)存儲方式(以關系數(shù)據庫存儲還(hái)是(shì)以文(wé÷©×↓n)件(jiàn)型存儲)以應對(duì)查✔≤詢效率的(de)要(yào)求。

系統永遠(yuǎn)保持其核心數(shù)據庫的¥σ♥✘(de)數(shù)據量在一(yī)個(gè)合理(♥®≤lǐ)的(de)盡可(kě)能(néng)小(xiǎo)€∞↕↔的(de)規模,并将其置于快(kuài)速存儲設備上(shàng)↔™α。系統對(duì)于會(huì)引發大(dà)量數(s&Ωhù)據列表顯示的(de)查詢盡量進行(xíng)優化(huà),在存儲大(₽"dà)批量數(shù)據時(shí)則會(huì)∞ ‌采用(yòng)分(fēn)段存儲和(hé¥♥)分(fēn)布式存儲。

三、系統部署方式

openBIS由客戶端,應用(yòng)服務器(qì),數(shù)據存儲服務器(q±÷ì)組成。

應用(yòng)服務器(qì)(application server ♣÷¥ 簡稱AS):管理(lǐ)元數(shù)據并關聯其指向的(de)基礎數(sh≈÷ ù)據。

數(shù)據存儲服務器(qì)(data >&★σstore server 簡稱DSS):管理(lǐ)數(shù)據

應用(yòng)服務器(qì)使用(yòng)關系數(shù)據庫來(lá>÷≈i)管理(lǐ)用(yòng)戶,用(yòng)戶身βσ$♠(shēn)份認證信息,系統實體(tǐ)對(≥'¶₩duì)象如(rú)數(shù)據空(kōng)間(jiā☆₹αn),實驗和(hé)樣品的(de)元數(shù)據以及所有(yǒ↑♦≥Ωu)數(shù)據集的(de)索引信息。數(shù)據存儲服務器(qì)DSSπΩ₽≥管理(lǐ)存在數(shù)據存儲區(qū)中的(de)數(sβ±÷hù)據集。該存儲區(qū)隻能(néng)≤<‌由DSS負責寫入,不(bù)能(néng)被系統其他(tā)部≠​>分(fēn)所操作(zuò)。不(bù)同類型的(de)客戶端如(rú)∞$✘浏覽器(qì),圖形化(huà)的(de)Matlab客戶端π ,命令行(xíng)客戶端能(néng)夠通(tōng)過AS和(hé)εΩδDSS訪問(wèn)openBIS。

在系統部署圖中,我們可(kě)以看(kàn)到(dào)一(α•yī)個(gè)AS可(kě)以對(duì)應多(duō)個(gè)DSS。×♣♦×這(zhè)一(yī)特性對(duì)于大(dà)↔¥ ‍科(kē)學工(gōng)程非常重要(yào),系統生(shπ¶ēng)物(wù)學,組學這(zhè)些(x≥≤iē)科(kē)學工(gōng)程往往需要(yào)多(duō)個(gè)實驗≥≠←室和(hé)單位的(de)參與,分(fēn)布式的(de)存儲對(duì)于πε♦促進數(shù)據共享的(de)同時(shí)進行(xíng)自(zì↑‌$)有(yǒu)知(zhī)識産權保護是(shì)有(α∑✔yǒu)雙重作(zuò)用(yòng)的(de)。openBIS≈÷&∞ 的(de)分(fēn)布式DSS特性允>←✘許各個(gè)實驗室使用(yòng)本地(dì)的••≤(de)數(shù)據存儲服務器(qì)(DS¥"'≠S)存儲本地(dì)儀器(qì)産生(sh∑λ↑ ēng)的(de)數(shù)據。這(zhè)裡(lǐ)DSS命名為(wèi)π±↕數(shù)據存儲服務器(qì)而不(bù)是(shì)簡單的(d$☆'≠e)稱之為(wèi)數(shù)據庫服務器✔δ¶®(qì)是(shì)自(zì)有(yǒu)其道(dào)理(÷™λ™lǐ)的(de),openBIS采用(yòng)混合數≤λ§(shù)據存儲模式,即數(shù)據庫存儲和(hé)文(wé✘ ★σn)件(jiàn)存儲相(xiàng)結合,而不(bù)是(π÷∑shì)單一(yī)的(de)數(shù)據庫存儲模式。DSS從(cóng)Ω∏設計(jì)來(lái)說(shuō),并不‍§ (bù)僅僅是(shì)一(yī)個(gè)置于因特網上(shàng∏>★•)的(de)文(wén)件(jiàn)服務¥₩器(qì)。它能(néng)以其自(zì)Ωε身(shēn)存儲的(de)數(shù)據為(wèi)基礎進行(xí•​ng)各種自(zì)定義的(de)查詢,并啓用€ (yòng)其自(zì)身(shēn)的(de)關系數♣♥ (shù)據庫去(qù)存儲結果型數(shù)據。<★這(zhè)些(xiē)結果數(shù)據∏₽↕寫入數(shù)據庫的(de)操作(zuò)可(‌βγ₹kě)以在數(shù)據載入時(shí)自(zì₹₩>)動進行(xíng)。在下(xià)圖中,用(yòng)戶通÷☆(tōng)過命令行(xíng)工(gōng)具>✘和(hé)MatLab客戶端可(kě)以通(tōng)過op♠'♠enBIS提供的(de)API訪問(wèn)DSS提供的(de)服務。進一(y♣€≈♦ī)步,在現(xiàn)有(yǒu)基礎上(shàng)還(hái)可¥>(kě)以為(wèi)DSS添加協處理(lǐ)服務器(qì)用(yòng)♣±于數(shù)據的(de)傳輸,例如(rú)Datam&♥​∞over和(hé)CIFEX等組件(jiàn)用(yòng)于數(shù)據®γ©↕的(de)導入和(hé)導出。

一(yī)款開(kāi)源的(de)系統生(shēng)物(wù)研究數(shù)據管理(lǐ)系統——OpenBIS


AS和(hé)DSS各司其職,AS專門(mén)處理★™‌ε(lǐ)元數(shù)據并指向原始的(de)來(lái☆₽✔✘)源,分(fēn)布式的(de)多(duō)個(gè)ε¶©DSS負責處理(lǐ)大(dà)規模數(shù)據。龐大(dà​↕↕)的(de)原始數(shù)據和(hé)精簡的(de)元數(shù)據得(d∑↔≤e)以分(fēn)離(lí),從(cónα g)而避免了(le)查詢和(hé)傳輸高(gāo>÷∏±)通(tōng)量和(hé)高(gāo)內(nèi)涵數(shù)據所帶來(∞←αlái)的(de)高(gāo)昂的(de)系統開(kāi™'✔)銷疊加,如(rú)CPU的(de)使用(yòng),IO和(hé)帶寬的(d≤<e)占用(yòng)。

3.1  OpenBIS的(de)客戶端

openBIS自(zì)帶了(le)圖形化(huàε₽∑)的(de)Web應用(yòng)程序,命令行(xíng)工(g¥₽ōng)具和(hé)一(yī)些(xiē)KNI↑'ME數(shù)據分(fēn)析管道(dào)節點。為 γ(wèi)了(le)方便專業(yè)用(yòn"↔♥ g)戶通(tōng)過客戶端訪問(wèn)後台,系統提供≈π∑了(le)可(kě)通(tōng)過TCP/IP網絡調用(yòng)的(d↕©δ₩e)API。

3.2  應用(yòng)服務器(qì)(AS)

AS是(shì)客戶端與系統交互的(de)中心,其配置有(yǒu)一(y¥♥ī)個(gè)關系型的(de)數(shù)據庫,用‌ (yòng)于管理(lǐ)和(hé)存儲關于樣品,實♦≤σ驗,數(shù)據集的(de)元數(shù)據;實際的(de)數(shù)據由σ§±δDSS存儲和(hé)管理(lǐ),AS引導訪問(w£>'èn)一(yī)個(gè)或多(duō)個(gè)DSS。

AS自(zì)身(shēn)分(fēn)解成幾個(gè)層級:

展示層(Presentation layer):HTML和(hé)Java Script 用(yòng®✘↕)于客戶端展示

域層(Domain Layer):為(wèi)希望與業(yè)務對(duì)象(樣品,實φ<δ₽驗)進行(xíng)交互的(de)用(yòng)戶提供服務

數(shù)據訪問(wèn)層(Data✔≈ acess layer):用(yòng)于AS與DSS之間(jiān)的(de)訪問(wèn)&Ω♠$,由AS所私有(yǒu),不(bù)由外(wài)部調用(yòn₩×♥g)

前三個(gè)服務不(bù)僅為(wèi)Weε↕αb客戶端所使用(yòng),還(hái)能(né$♠≠ng)由命令行(xíng)工(gōng)具程序和(hé)DSS♥®所調用(yòng)。典型的(de)服務如(rú)樣品查詢,對(du→₹ì)象在數(shù)據庫中的(de)注冊。

3.3 數(shù)據存儲服務器(qì)(DSS)

DSS采用(yòng)混合存儲模式管理(lǐ)數(shù)據∑←↔¶集所包括的(de)所有(yǒu)數(shù)據,如(rú)圖像®♠、譜圖、分(fēn)析結果或特征描述。這(zhè)些(xiē)數(shù)據∑✔¶↓都(dōu)放(fàng)在數(shù)據存儲系統中。DSS負責對(duì)這φ (zhè)些(xiē)數(shù)據查詢,基于​€☆數(shù)據集的(de)報(bào)告以及可(kě)視(shì)化(hu↓$Ω&à)。

在扁平的(de)文(wén)件(jiàn)存儲模式下(xià),數(sh↑↓ 'ù)據存儲由單份組成(一(yī)般由一(>‍yī)個(gè)文(wén)件(jiàn)服務器(qì)提供),分(fē↓£₩n)段存儲模式下(xià),一(yī)個(gè)↔→"數(shù)據存儲有(yǒu)多(duō)個(gè)數(₩¶↕ shù)據份,每一(yī)個(gè)文(wén)件(jiàn)服務$☆β 器(qì)管理(lǐ)其中一(yī)份。

與AS類似,DSS也(yě)可(kě)分(fēn)為(wèi)展示層(✘ ≈÷presentation layer),域層(domain layer),數ε (shù)據訪問(wèn)層(data access layer) β↕∑;

展示層(presentation layer),負責數(shù)↓ 據的(de)展示,一(yī)般而言,不(bù)外(wài)乎類似于為(wèi✘‌÷♥)某張圖片用(yòng)于HTML顯示而提供URL地(dì)址之類的(de)事 δ™(shì)物(wù)。更複雜(zá)一(yī)點的(de)将以→✔×Tab鍵為(wèi)分(fēn)隔符的(de)文(wén)件& ↕ε(jiàn)在網頁上(shàng)以表格的(de)形式展示,更深層≈↑♣∞次的(de)展示需要(yào)用(yòng)βλ戶對(duì)對(duì)數(shù)據有♦"<←(yǒu)更深入的(de)理(lǐ)解,例如(rú)數(shù)據可(≤≤>kě)視(shì)化(huà)中的(de¥♣)熱(rè)點圖,或将代表不(bù)同通(™♠→®tōng)道(dào)數(shù)據的(de)圖進行(x¶>•íng)組合。這(zhè)些(xiē)功能(néng)我們将在open&₩‌☆BIS的(de)第二篇文(wén)章(z÷∏↑hāng)中做(zuò)簡單的(de)介紹。數(shù)據集上(shàn☆ ≈g)載器(qì)(Data Set Uploader)也(yě)屬γ↔于展示層的(de)一(yī)部分(fēn),其是(shì)基于網↕✔頁的(de)數(shù)據集批量上(shàng)載工(gōng)具。£®↔↑為(wèi)避免浏覽器(qì)對(duì)上(shàng<Ωπ♠)載文(wén)件(jiàn)2GB大(dà)小(xiǎo) ™的(de)限制(zhì),該工(gōng)具通(tōng)過Java WebS✔£÷♦tart執行(xíng)。

域層(Domain Layer),負責提→δ₹供數(shù)據的(de)訪問(wèn),并能(néng≥↑§)解析其數(shù)據格式和(hé)語義關系$∞♠。ETL(提取,轉換,上(shàng)傳)線程也(yě)屬于該層,§ππ∑其負責注冊新産生(shēng)的(de)數(♦∑shù)據集。舉一(yī)個(gè)DSS的(de)典型的(de)應用(yò↕★‍ng)的(de)例子(zǐ),ETL線程監控某個(gδ‍¥è)文(wén)件(jiàn)夾中的(de)事(shì)件(jiàn✔")發生(shēng)情況,如(rú)果該文(wén)件€¶π(jiàn)夾中新創建了(le)文(wén)件(jià☆∑>n)或文(wén)件(jiàn)夾,ETL ↓将執行(xíng)相(xiàng)關的(de)✘§操作(zuò)。

數(shù)據訪問(wèn)層(data acσ↕→cess layer),用(yòng)于生(shēngγ✘< )成DSS中文(wén)件(jiàn)存儲系統的♣©₽(de)摘要(yào)。該摘要(yào)使得(♣÷de)DSS能(néng)夠利用(yòng)RDBMS中的(de<>)文(wén)件(jiàn)元數(shù)據從(cóng)而加速 ®ε∑檢索和(hé)列表顯示,透明(míng)地(∑₽↕dì)訪問(wèn)容器(qì)文(wén)件(jiàn)(HD♣απF5容器(qì)以目錄的(de)形式顯示),并将同一(yī)個(gè)數(sh∏✘£ù)據集容器(qì)中的(de)多(duō)個(gè)數(shù)據集的'™ (de)目錄列表彙總顯示。

3.4、CIFEX

CIFEX是(shì)openBIS系統的(de)輔助工(gōng)具,全稱♦©₽λ叫CISD文(wén)件(jiàn)交換™β♥€工(gōng)具(CISD Exchanger).CIFEX 是(shì)↔ ‍÷一(yī)個(gè)基于Web的(de)應用(yòng)程序,用(yòn≥§g)于傳送和(hé)交換大(dà)的(de)數(shù)據≤™文(wén)件(jiàn)。由于浏覽器(qì)對(duì)于上(s₽¶♥≥hàng)傳容量有(yǒu)2GB的(de)限制(zhì),≤✘CIFEX采用(yòng)基于Java Webstart λ☆ 圖形化(huà)工(gōng)具,支持斷點續傳并進行(xíng)校(xià ↓​&o)驗和(hé)檢查以保證文(wén)件(jiàn)完整性。CI λFEX主要(yào)用(yòng)于下(xià)載openBIS中φ¥λ存儲的(de)超大(dà)的(de)數(shù∏‍® )據集。如(rú)果用(yòng)戶能(néng)夠δ±π↑直接訪問(wèn)DSS數(shù)據存儲的(dλ↕​"e)文(wén)件(jiàn)系統,則CIFEX并÷ £非是(shì)必須的(de)。但(dàn)大(dà"α)多(duō)數(shù)用(yòng)戶是($¶↕shì)無法直接訪問(wèn)DSS文(wén)件(jiàn)系統的(de)α±&☆,而如(rú)果有(yǒu)人(rén)想把一(yī)些(xiē)←β≈ 數(shù)據分(fēn)享給沒有(yǒu)openBIS₹£× 賬号的(de)人(rén),那(nà)麽C€∑δIFEX就(jiù)可(kě)以幫助實現(xiàn)→€§"這(zhè)一(yī)目的(de)。大(dà)家(jiā)知∏×(zhī)道(dào),系統生(shēng)物(wγ≤ù)學和(hé)相(xiàng)關的(de↔€₹)組學的(de)分(fēn)析數(shù)據都(dōu)是(sγγ™λhì)十分(fēn)龐大(dà)的(de),多(duō)達幾個(gè)€γ​G。此時(shí)研究人(rén)員(yuán)通(tōng)過郵件(jià®§₹γn)發送這(zhè)些(xiē)數(shù)據集不(bù)太現(xiànλ→ ±)實。在這(zhè)種應用(yòng)下(x♠¥ià),CIFEX成為(wèi)了(le)數(shù)據與ope‍©±'nBIS系統之間(jiān)雙向流通(tōng)的(de)通(tōng)道(ε∏dào)。CIFEX系統同樣也(yě)是(shì≥₹₩)開(kāi)源的(de),并可(kě)提供下€≥×(xià)載。

3.5、Datamover

顧名思義,Datamover是(shì)用(∞♦yòng)于數(shù)據從(cóng)一(yī)個(gè)¥∞←↔地(dì)點傳輸到(dào)另一(yī)個(g™π>è)地(dì)點。其可(kě)使用(yòng)本地(dì)發起的(σ✘©£de)文(wén)件(jiàn)共享或是(shì)通(tōng)過SSH$§₩通(tōng)道(dào)(建立在應用(yòng&σ)層和(hé)傳輸層基礎上(shàng)的(de)安全協議(€>γyì))或遠(yuǎn)程主機(jī)同步進行(xíng)數(shù)據的(d×≥•e)傳輸。該工(gōng)具主要(yào)是(shì)用(yòng♦∞)于将儀器(qì)直接連接的(de)計(jì)算(s ←uàn)機(jī)上(shàng)的(de)≈β∞★數(shù)據轉移到(dào)一(yī)個(gèπ )過渡性的(de)中間(jiān)存儲設備上(shàng)。組學研究的(d≥€e)數(shù)據往往十分(fēn)龐大(dà),與儀器(q¶↕®©ì)相(xiàng)連的(de)計(jì)®₹算(suàn)機(jī)的(de)磁盤很(hěn)±§σ♥快(kuài)就(jiù)會(huì)超¶→過容量。将儀器(qì)相(xiàng)連計(jì)算(suàn)機(jī)$π上(shàng)的(de)文(wén)件(jiàn)夾直接對(duì)應到(dσ₽§ào)DSS的(de)存儲區(qū)往往又(yòu)₩↑€會(huì)受制(zhì)于網絡的(de)好(hǎo)壞。要(yà₹→o)知(zhī)道(dào),網絡往往不(bù)太穩定。此時(shí)就(ji≥>ù)需要(yào)在DSS存儲區(qū)與分(fēn)析儀器(qì₽φ)計(jì)算(suàn)機(jī)之間(jiān)建立一≤φ(yī)個(gè)中間(jiān)過渡區(qū)♦★×‍,例如(rú)數(shù)據中心或者計(jì)算(suànγ↕​)集群,由Datamover不(bù)斷地(dì)将數(shù)據πλ★'遷移過去(qù)。Datamover在傳遞過→←₩程中解決遇到(dào)的(de)一(yī)©φ∏•切大(dà)小(xiǎo)故障,諸如(rú)網絡中斷,♠δ存儲設備達到(dào)上(shàng)限等問(wèn)題。

3.6、驗證與授權

openBIS采用(yòng)基于插件(ji₽β✘₽àn)的(de)機(jī)制(zhì)用(yòng)于用(yòng)✘‌戶驗證,可(kě)與LDAP(如(rú)微(wēi)軟Active Dicr®Ω¥≤ectory),Crowd等身(shēn)份識别系統以及簡單的(de)→✘ 文(wén)件(jiàn)方法進行(xíng)集成。系統采用(yòng)♦σ←↕分(fēn)組和(hé)角色的(de)授權機(jī)→γ≈δ制(zhì),解決特地(dì)用(yòng)戶能(néng)夠看&≈¥ (kàn)到(dào)哪些(xiē)數(∑≤δ©shù)據以及能(néng)夠進行(xíng)哪γσΩ¥些(xiē)操作(zuò)的(de)問(wèn)題。

四、系統的(de)功能(néng)模塊

OpenBIS的(de)核心功能(nén‍&g)包括數(shù)據和(hé)元數(shù)據的(de‍β₽>)管理(lǐ),數(shù)據檢索,數(shù)據₩™≠共享,數(shù)據導入導出,與其他(tā)系<₽§統的(de)接口。這(zhè)些(xiē)基礎功能(néng)↔$&★都(dōu)已經相(xiàng)當穩定,并可(kě)供下(xià♣≠™​)載,對(duì)于生(shēng)物(wù)γ∞₽學家(jiā)來(lái)說(shuō)±♠可(kě)謂是(shì)開(kāi)箱即用(yòng≥ •)。如(rú)果想要(yào)把openBIS作(zuò)為(wè ∑i)一(yī)個(gè)新的(de)系統整合到(dào)現☆₽∞>(xiàn)有(yǒu)的(de)工(gōng)作(zu♦≤‍₽ò)流程中則需要(yào)一(yī)定程度的(de)定制(zhì)化(☆♦₩<huà)開(kāi)發,并可(kě)在此基礎之上(shδ€♣♦àng)添加額外(wài)的(de)功能(nén≠§g),如(rú)可(kě)視(shì)化( ∞→₩huà),數(shù)據的(de)終端發布,定制(zhì)化(huà)的(de¥δ)查詢設計(jì)等等。如(rú)果單位上(shàng)配備有(yǒu)§±&∞經驗豐富的(de)開(kāi)發人(rén)員∏∏←(yuán),包括生(shēng)物(wù)信息↔↔$σ學研究人(rén)員(yuán),加上(shà♠ $∞ng)與實驗研究人(rén)員(yuán)相(xi¶$γλàng)互配合,我們可(kě)以将自(zì)己開(kā↑↓↑ i)發的(de)一(yī)些(xiē)特色化(huà)的(de)程$$₩φ序與openBIS進行(xíng)無縫整合從(cóng)而開(kā★≥σ>i)發出十分(fēn)強大(dà)的(de)應用(yòng)$∏σ₽。這(zhè)樣就(jiù)能(néng)更加緊密地(d≤§✔ì)貼合用(yòng)戶的(de)實際需求。畢竟系統是(sh ₽β ì)開(kāi)源的(de), 我們甚至可(kě)以直接修改源碼∏¶×♥對(duì)系統進行(xíng)個(gè)性化(huà)的(Ω≠®de)改造。

4.1、數(shù)據與元數(shù)據管理(lǐ)

如(rú)前文(wén)所述,系統采用(yòng)層級式結構組織數©™δΩ(shù)據和(hé)元數(shù)據。以數(shù)據空®  ©(kōng)間(jiān)為(wèi)基礎進行(xíng)授權。一☆λ÷(yī)般而言,在系統中會(huì)為(wèi♥×​)不(bù)同的(de)研究小(xiǎo)組創建不(bù)同的✔©(de)數(shù)據空(kōng)間(jiān)。數(shù)據空(kōn'♥☆‌g)間(jiān)下(xià)以項目,實≠§±β驗,樣品、數(shù)據集組織數(shù)據。系統可(kě ±≥)以基于訪問(wèn)的(de)需要(yào)設置觀察人(rén)員'δ₽(yuán)(對(duì)數(shù)據隻讀(dú)),一(y₹$↕≥ī)般用(yòng)戶(添加或編輯對(duì)•Ω 象)、并能(néng)以組和(hé)角色進行(xíng)統一(yī↕α™‌)授權。在數(shù)據發布環節上(shàng),研究人(rén)員(yuáσ'n)可(kě)以非常方便地(dì)改變其所擁有(yǒu)數(shù)據δ↕✔的(de)權限設置,從(cóng)而使其對(duì)外(wài)公布βσ。openBIS為(wèi)分(fēn)析結果提供優良的(de)溯源性。一€≠ ₹(yī)個(gè)新的(de)數(shù)據集創建會(huì)→≤↕分(fēn)配一(yī)個(gè)唯一(y∑÷σ←ī)的(de)标識号并且不(bù)能(néng)再作(zuò)₽×₩<改變。如(rú)果數(shù)據由一(yī)個(gè)或多(duō)個(gèπ¥↑)數(shù)據集衍生(shēng)而來(lái),系統會(huπ•↕£ì)創建一(yī)個(gè)新的(de)子(zǐ)數(shù)據集,并将該數(€÷≠shù)據集歸屬到(dào)其來(lái)源數(sh↕€≤ù)據集。

獨立于某種專門(mén)的(de)數(shù)據格式和(hé)存儲方式,無論是λ‍Ω​(shì)儀器(qì)原始數(shù)據還(h$£ái)是(shì)數(shù)據分(fēn)析管路(lù)₩§₹<所提交的(de)數(shù)據結果,都(dōu)可(kě)以直接存儲在openπα≤₩BIS 中而不(bù)需要(yào)對(duì)格式進行(xín<≠™g)轉化(huà)或其他(tā)改變。如(✔ε'rú)果需要(yào)其他(tā)的(de)數(shù)據格£♦∑¥式和(hé)存儲方式,也(yě)可(kě)以通(tōng)過數(shù↑✘£)據轉換工(gōng)具自(zì)動完成。一(yī)般建議(yì)用(yòng↔♠€)戶為(wèi)數(shù)據的(de)新格∑α式單獨創建一(yī)個(gè)新的(de)數(shù)據集,←∏ •并将同樣一(yī)份數(shù)據的(de)不(b™©✔ù)同格式放(fàng)在一(yī)個(gè)數(shù₽​∑)據集容器(qì)中。為(wèi)了(le)使得(de)數(shù)據÷→ 集容器(qì)對(duì)用(yòng)戶透明(m→<íng),openBIS會(huì)顯示其文(wén)件(jià¥≥n)系統視(shì)圖,顯示包含在該數(shù)據容器(qì)中的(de®$"∞)所有(yǒu)文(wén)件(jiàn)。

4.2數(shù)據檢索、導出和(hé)分(fēε₹'₩n)享

大(dà)規模數(shù)據的(de)導出采用(yòng)CI☆₹FEX。數(shù)據集檢索基于數(shù£∞α)據集識别碼、數(shù)據集類型(如(rú)原始數(shù)據,蛋白(≤​δ♦bái)結果數(shù)據)、文(wén)件(jiàn)類型('★φmzXML,protXML)以及其他(tā)與數(sε™hù)據集、樣品、實驗相(xiàng)關的(de)元數(shù∑£♦→)據(例如(rú)數(shù)據轉換軟件(πΩ≤jiàn)的(de)名稱)。結合這(zhè)些(xiē)元數(s <hù)據可(kě)以進行(xíng)常規的(de)邏輯篩選操作(zuò),例如​​(rú)字符串的(de)比較,數(shù)值的(d≥‍♣e)範圍限定等,最終選擇的(de)數(shù)據•$可(kě)以方便地(dì)通(tōng)過電('± diàn)子(zǐ)表格導出。如(rú)果查詢結果涉及大(dà)規模數( φ&∞shù)據,這(zhè)在組學研究中經常會₩β₽ (huì)碰到(dào),此時(shí)系統将會(hu¥>♣ì)自(zì)動重定向到(dào)CIFEX進行(xíng)導出,φ≈openBIS通(tōng)過這(zhè)種方法能(néng)夠用(y∏→òng)來(lái)分(fēn)享數(shù±ε₹ )據,例如(rú)為(wèi)下(xià)遊的(de)數(shù)學建¥‌模人(rén)員(yuán)提供數(shù)據。

4.3、數(shù)據導入方式

對(duì)于涉及數(shù)百M到(dào)數(shù)個(gè)≤♥G大(dà)小(xiǎo)的(de)蛋白(bái)質質譜數(shù)據來βφδφ(lái)說(shuō),數(shù)據如(rú)✘&何進入系統中集中管理(lǐ)是(shì)個(gè)比較關鍵的(>π→ de)問(wèn)題。根據不(bù)同的(de)使用(yòng)需要(yà↓♥<≠o),數(shù)據上(shàng)傳到(dào)openBIS>¶中采用(yòng)三種不(bù)同的(de)方式:Dropbox,網頁上(sφ≈hàng)直接上(shàng)傳,通(tōng)過遠(♥λ yuǎn)端API自(zì)定義程序上(shàng)傳。

第一(yī)種方式是(shì)采用(yòng)所謂的(de)dropbox<←,所謂Dropbox實際上(shàng)是(shδ≠←ì)位于本地(dì)文(wén)件(jiàn)系統 ★‍或文(wén)件(jiàn)服務器(qì)上(shàng)的(de)文(wé∞♣¥n)件(jiàn)存放(fàng)目錄。DSS監π←★視(shì)該目錄中的(de)寫入情況。₹↑☆如(rú)果發現(xiàn)新的(de)數(shù)據,例如(rú)新←★建了(le)某個(gè)文(wén)件(jiàn)或δ"÷文(wén)件(jiàn)夾,系統就(jiù)會(huì)啓用(yòng)✔↔為(wèi)該dropbox配置的(de)ETL(提取、‌<☆ 轉換、上(shàng)載)流程,使得(de)該新産生(s₽φhēng)的(de)數(shù)據集能(néng)為(wèi)openBI€≠₽S系統所接受,在此過程中并将其與适當的(de)對(duì)象關聯(λ♣™例如(rú)某個(gè)樣品),提取相(xiàng)關元數(s&<‍∏hù)據用(yòng)于檢索,并将這(zhè)些(xiē)數(sh÷©ù)據集轉換為(wèi)預定義的(de)格¥✘式,以便與諸如(rú)計(jì)算(suàn)模拟之類→<×¶的(de)其他(tā)工(gōng)具集成。ET£₽γ₽L過程在openBIS系統中并非是(shì)固定的(de),而是(shì)設計€₹(jì)為(wèi)一(yī)組可(kě¶δ)配置的(de)插件(jiàn),在對(du★‍γì)新産生(shēng)的(de)數(shù)據如(​↔€rú)何處理(lǐ)的(de)問(wèn)題上(shàng)具有(y§×®ǒu)很(hěn)高(gāo)的(de)可(kě)配置性和(hé)自±€(zì)由度。一(yī)般而言,在數(shù)據存儲容量夠大(dà)的(ε÷∏‍de)前提下(xià),建議(yì)ETL處理(lǐ)的(de)同時(sh∏φ©í)保留未經處理(lǐ)的(de)原始數(>∏shù)據。如(rú)果使用(yòng)Datamover作(zuò)ε€‍®為(wèi)協處理(lǐ)服務器(qì),dropbox可(kě®<↔©)擴展為(wèi)連接各個(gè)不(bù)同實驗♦←$室的(de)橋梁,從(cóng)而實現(xiàn)跨單位合作(£Ω¥¶zuò)。在長(cháng)期需要(yào)大(dà✔δ♠₽)量交換數(shù)據的(de)系統之間(jiān),dropγ←box可(kě)以充當一(yī)種非常有(yǒu)效的(de)£♣γ¶”松散耦合”的(de)接口。

第二種方式采用(yòng)網頁直接上(shàn↓±☆ g)傳,基于web的(de)上(shàng)傳工(gōng)具可← (kě)以從(cóng)web上(shàng)觸發。對(duì)于實際​↕γ的(de)數(shù)據上(shàng)傳步驟,會(hu÷¥₽ì)将用(yòng)戶重定向到(dào)Data se≥≥λ♠t uploader或者重定向到(dào)CIEFX服務器φ→↓∏(qì)。

第三種方式是(shì)API進行(xíng)定制(zhì)化✘α(huà)程序開(kāi)發,系統提供的(de)遠(yuǎn)端API是(shì)一(yī) ↕¥•組Java類,提供基于流的(de)編程模式用(yòng)于上(shàng÷★σ‍)傳任何構成數(shù)據集的(de)文(wén)件(jiàn)集合。₹γ✔與dropbox相(xiàng)比,其允許與使用(yòng)®↑♥它的(de)程序更緊密的(de)集成,提供及時(shí)的(de)反 ♥∏ 饋,支持任何允許HTTPS傳輸的(de)WA≤ΩαφN網絡。由于使用(yòng)Java作(z¶↔$uò)為(wèi)編程環境在某些(xiē)情況下(xi'≠∏✔à)受到(dào)限制(zhì),openBIS還(hái)包¶ ↓↔含了(le)命令行(xíng)工(gōng)具用(yòng)于調∏®₽用(yòng)遠(yuǎn)端API調用(×£∏yòng)實現(xiàn)數(shù)據的(de)上(shàngβ₹♥)傳。該工(gōng)具已經用(yòng)來(lái)實現(x±φ∏ iàn)LabView 和(hé)其他(tā)基₩∞于腳本的(de)數(shù)據源與openBIS 的(de)>↔整合。

4.4、用(yòng)戶端接入

第一(yī)種方式是(shì)圖形化(huà)的(de)界✔₹面,适用(yòng)于普通(tōng)用(y↓≠σ òng)戶。 

第二種是(shì)命令行(xíng)界面,适用(yòng)于專家(ji≈δā)級用(yòng)戶,用(yòng)在腳本編♦✘β£程環境中實現(xiàn)操作(zuò)的(×₩ de)自(zì)動化(huà),方便與各種自(zì)動化(h♠‌λ uà)的(de)數(shù)據處理(lǐ)管™↓≈線整合,或者整合進定制(zhì)化(huà)的(de)用(yò λ¥ng)戶界面,尤其是(shì)在API不(bù)能(néng)使用(y ‍‍"òng)的(de)情況下(xià)。

第三種是(shì)API調用(yòng)。該方法提供了(le)兩種方式,Ja↔‍va service和(hé)JSON-PRS web Servic₹←±e。Java 服務為(wèi)開(kāi)開(kāi)發者提供類和(hé)方法 γ≥≥用(yòng)于将OpenBIS整合進其他(tā)應用(↑≤£©yòng)程序,通(tōng)過使用(yòng)這(zhè)種AP∞↕I ,開(kāi)發者可(kě)以很(hěn)方便無縫地(dì)将openB$≈IS整合進其自(zì)己開(kāi)發的(de★≈)應用(yòng)程序,如(rú)工(gōng)作(zuò)流和™♠(hé)可(kě)視(shì)化(huà)工(gōng)γ>'→具。這(zhè)些(xiē)API盡管是(shì)用(yòn>σg)Java實現(xiàn)的(de),但(dà≈↓εn)并不(bù)僅限于用(yòng)在基于Java的(de)應用(​Ω®yòng)程序。許多(duō)流行(xíng)的(de)數(s↓'© hù)據處理(lǐ)環境,如(rú)Matlab,R都(dōu)可(kě)α∏以調用(yòng)Java API的(de)功能(néng)‌π 。事(shì)實上(shàng)系統專門(mén)為(wèi)>→↕MatLab提供了(le)其API的(de)變體(tǐ)-HCS-API,用(y•©♥↕òng)于支持Matlab的(de)語言特性。JSON-Pπ≈RC Web Service雖然沒有(yǒu)Java Servic<¥e那(nà)麽高(gāo)級,在所有(yǒu)的(de)支持Web↔♣标準的(de)計(jì)算(suàn)機(jī)環境中也(yě)都(dō≠$÷‍u)能(néng)應用(yòng)。特别是(shì)任何的(de)WEBα÷程序對(duì)openBIS 後端的(de)←↑使用(yòng)。

4.5、數(shù)據可(kě)視(shì✔÷♥™)化(huà)與發布

openBIS中的(de)數(shù)據可(kě)視(s✘©λ®hì)化(huà)往往要(yào)借助整合其他(t≥‍♥ā)的(de)軟件(jiàn)。一(yī)♠∑£±個(gè)簡單的(de)例子(zǐ)就(jiù)是(shì)采用(yòngβ♦)數(shù)據報(bào)告插件(jiδ✘®®àn)用(yòng)于展示HTML文(wén)件(jiàn),例如(rú)Ilλσ↕lumina HiSeq2000測序儀軟件(jiàn)産生(shēng)¥←的(de)數(shù)據。更加複雜(zá)的(de)展示≈β♣工(gōng)具,如(rú)孔闆視(shì)圖顯示☆'≤Ω多(duō)位滴定闆,特征向量的(de)圖形化(∑×∑huà)展示,用(yòng)于高(gāo)內(nèi)涵篩選和(hé∑₩☆)蛋白(bái)質組學的(de)蛋白(bái↕♦)質視(shì)圖(展示蛋白(bái)的(de)定性γ×和(hé)定量數(shù)據)。或者整合現(xià≈←n)有(yǒu)的(de)視(shì)圖,如(rú)使用(yòng)API實現"₩≥δ(xiàn)圖像強度-尺度再調節工(gōng)具。

就(jiù)數(shù)據的(de)終端發↔₹布而言,系統中數(shù)據的(de)簡單視(sh≠Ω€ ì)圖可(kě)以通(tōng)過Web界面的(de)配置快(kuài)速實現β♠↕(xiàn)。從(cóng)系統的(de)應用(yσβòng)經驗來(lái)看(kàn),基于openBIS框架可(k ÷ě)以實現(xiàn)滿足各種需要(yào)的(de)任何數(shù)¥→據類型的(de)視(shì)圖。

五、總結

openBIS是(shì)一(yī)款開(kāi)源的•↑(de),基于Web的(de)用(yòng)于管理(lǐ)大(dà)規模✔≠生(shēng)物(wù)學研究數(shù)據的(de)軟件(jiàn)®φ•,其具有(yǒu)異構、松散耦合、分(fēn)布式等多(€Ωduō)重特性,易于與各種軟件(jiàn)工(gōng)具進行(xín‍↔✘g)整合。系統采用(yòng)項目化(huà)的(de)結構用®≈✘∑(yòng)于管理(lǐ)實驗數(shù)據,處理(lǐ)用(yòng)戶★​身(shēn)份認證和(hé)授權,以及數(shù)據的(de)導入和(hé♠')導出,數(shù)據溯源,支持數(shù)據格式的(de)遷移和(h✘→πλé)數(shù)據的(de)歸檔。

 

下(xià)一(yī)篇文(wén)章(zhāng)中,我們将介"ε​÷紹openBIS在下(xià)一(yī)代的(de)基♣​♣因測序,高(gāo)內(nèi)涵篩選,定量圖像,蛋白(bá£≥€i)質組學,代謝(xiè)組學方面的(de)應用(yòn→↕g)。