聯系我們contact
電(diàn)話(huà):027-59760188-801
地(dì)址:武漢市(shì)東(dōng)湖(hú)高(★">↔gāo)新開(kāi)發區(qū)光(guāng)谷大σ✘(dà)道(dào)120号現(xiàn)代森(sēn♠&)林(lín)小(xiǎo)鎮A座609室
分(fēn)析儀器(qì)原始數(shù)據格式的(de)通(tōng₩★)用(yòng)标準AnIML
發布時(shí)間(jiān):2018-03-18 浏覽次數(shù):1023次
所有(yǒu)實驗室面對(duì)一(yī)個(gè)共同問(λ♣'wèn)題是(shì)實驗數(shù)據的(d<₹e)處理(lǐ)和(hé)交換,這(zhè)裡(lǐ)尤其 ∞以分(fēn)析實驗室最為(wèi)典型。我們走訪諸$₽α多(duō)分(fēn)析實驗室時(shí),大(dà)家(jiā)談到(♦αdào)最多(duō)的(de)就(jiù)是(shì)分(fēn)析儀器✔ ♦(qì)的(de)原始數(shù)據,包括其保存,處理(lǐ),再分(fēn)↔§δγ析等問(wèn)題。大(dà)家(jiā)都(÷∏dōu)有(yǒu)一(yī)個(gè)烏托邦式的(de)夢想,©Ω≤¶那(nà)就(jiù)是(shì)可(kě)以用(yòng)一(£♣Ωyī)種軟件(jiàn)打開(kāi)多(du♥ "←ō)個(gè)不(bù)同廠(chǎng)家(jiā),不(bù)同類型的∞₩©✘(de)分(fēn)析數(shù)據。夢想歸夢$β想,現(xiàn)實仍然是(shì)現(xiàn)實×₹'。儀器(qì)供應商們提供儀器(qì)的(dλφδ e)同時(shí)都(dōu)會(huì)采用(yòng) ✔≈自(zì)己的(de)專有(yǒu)格式的(deλφ)數(shù)據,這(zhè)導緻了(le)數(shù)據處理(lα§₽ǐ),協作(zuò),儀器(qì)集成和(hé)存檔遇到(dào)很(hěn∞♥)多(duō)問(wèn)題。在處理(lǐ)這(zhè)些(xiē)原始數( ±♣shù)據時(shí)除了(le)廠(chǎng)家(jiā)配套的(de)λ'§軟件(jiàn),很(hěn)少(shǎo)有₽₽(yǒu)可(kě)選的(de)餘地(dì)。
從(cóng)2003年(nián)開(kāi)始,∏↓> ASTM E13.15小(xiǎo)組委員(yuán<₹φ)會(huì)開(kāi)始籌劃開(kāi)發一(y↓ ī)套分(fēn)析數(shù)據的(de)通(tōng)用Ωφ(yòng)标準,力求适用(yòng)于所有(yǒu)分(f®♣ēn)析儀器(qì)技(jì)術(shù),并将其命名為(wèi)AnIML↔£β。為(wèi)了(le)平衡各方利益,該小(xiǎo)組聚集了(le←₽γ)來(lái)自(zì)儀器(qì)廠(chǎng)商,最終用(yòng)←↔戶,政府機(jī)構和(hé)學術(shù)界的(de)人(rén)士,共同商✘討(tǎo)以确保格式完整,适用(yòng)性強。
AnIML并不(bù)是(shì)業(yè)界第一(yī®←×™)次嘗試将分(fēn)析數(shù)據标準化(huà)。之前已經設計(jì♣≠÷)過多(duō)種标準,如(rú)ANDI(也(yě)叫NetCDF,适用( £yòng)于GC,LC,MS),JCAMP-DX(IR,FTI♥↔↓εR,NMR,UV/Vis),SpectroML(分(fēn)±∏ ∑子(zǐ)光(guāng)譜數(shù)據)以及mzML(質譜≥♠ ),以及一(yī)些(xiē)儀器(qì)公司倡導的(de)>π♦ 标準,如(rú)Thermo 所提出的(de)G®∞®♣AML。雖說(shuō)這(zhè)些(xiē)數(shù)據格式在分(✘ '♣fēn)析儀器(qì)行(xíng)業(yè)取得(↓♥de)了(le)較大(dà)的(de)支持力度,但(dàn)它們大(dà)都↕<(dōu)隻針對(duì)特定的(de)分(fēβ↕n)析技(jì)術(shù),例如(rú)JCAMP-DX主要(yào)針對(α↑≤duì)的(de)光(guāng)譜技(jì)術(s&δ×πhù),而AnIML期望建立的(de)是(shì)一(yī)種适用↕≠δ≤(yòng)于所有(yǒu)分(fēn)析技(jì)術(shù)的λ$ (de)數(shù)據格式。借助清晰完整的(de)擴展方式,即便将來∞λ♠(lái)出現(xiàn)了(le)新的(d&↔∑₹e)分(fēn)析技(jì)術(shù),也(yě)不(bù)用(yòng±™)改變現(xiàn)有(yǒu)的(de)♠♣軟件(jiàn),從(cóng)而簡化(huà)數(shù)據φ$♠±管理(lǐ)的(de)工(gōng)作(zuò)α✘。由此,XML這(zhè)門(mén)強大(dà)而影(yǐng)響深遠(y£δλ§uǎn)的(de)語言終于可(kě)以将其£↔>δ影(yǐng)響力擴展到(dào)分(fēn)析實驗室。
AnIML是(shì)基于W3C XML标準的(©≤de)技(jì)術(shù)。XML獨立±$₩于平台,易于創建,使用(yòng)和(hé)維護。這(zhè∏♣β)降低(dī)了(le)使用(yòng)門(mé≤★α$n)檻,幾乎所有(yǒu)的(de)主流軟件(jiàn)開(kāi)發×≈₩商都(dōu)支持XML,并且存在大(dà)量以XML格式為(w&→∑←èi)基礎的(de)工(gōng)具。 由于XML是(shì)基于文(wén&←>φ)本的(de)。因此可(kě)以用(yòng)最簡單的(de)文(wén)本↑編輯器(qì)編輯AnIML文(wén)件(jiàn) – 而±<¶不(bù)需要(yào)特定的(de)軟件(jiàn)。盡管這(zhè)φ✘Ω樣不(bù)一(yī)定方便,但(dàn)保留這(zhè)一(yī)特×♦←性是(shì)用(yòng)于長(cháng)期數(shù)據保存方案的™₩↔(de)關鍵:即使丢失了(le)之前的(de)軟件(jiσ★±δàn),我們仍舊(jiù)可(kě)以獲取我們需要(yào)的(de)數(sh•&ù)據。
實現(xiàn)AnIML的(de)靈活性和(hé)通(tōng)用> (yòng)性的(de)方法并不(bù)複≠ 雜(zá),AnIML數(shù)據标準包含兩個(gè)部分(fēn)•γα,一(yī)個(gè)是(shì)通(tōng)用(yòng)的(de)₩&♦數(shù)據容器(qì),稱為(wèi)AnIεδML核心(AnIML core),可(kě)以存儲任何科(kē)學數(shù)✘β≥∏據。構成AnIML核心的(de)包括樣品數(shù)據集↓✔(SampleSet)、實驗步驟數(sh₩λù)據集(ExperimentStepSet)、審計(jì)™★←™跟蹤記錄數(shù)據集(AuditTrailE®"Ω¥ntrySet)、簽名記錄集(SignatureSet)。
在AnIML的(de)核心之上(shàng),是(shì)“技(jì)術(shφ♥® ù)定義”(Technique Definition≠✘π)部分(fēn),所謂的(de)“技(jì)術(shù)定義”就(jiù)是≤Ω(shì)說(shuō)明(míng)針對(duì)某種分$♦ ÷(fēn)析技(jì)術(shù)如(rú)何去(qù)✔¶使用(yòng)數(shù)據容器(qì)。技(jì)術(shù)定義(♠←÷Technique Definition)可(kě)以被看(kàn)♣¶作(zuò)是(shì)記錄某種分(fēn)析實驗所需要(yào)±"的(de)數(shù)據字段的(de)目錄。技≠§(jì)術(shù)定義文(wén)件(jiàn)屬®α于常規的(de)XML文(wén)件(jiàn)中的(de)DTD文(wé©↔≥n)件(jiàn),可(kě)以随時(shí)重新創建↔∞↔♥。通(tōng)過 DTD,每一(yī)個(gè) XML 文(wén)←£件(jiàn)均可(kě)攜帶一(yī)個(gè)有(yǒu)關其自(¶γzì)身(shēn)格式的(de)描述。雖說(shuō)AnIML是(shì)σδ普适性的(de),但(dàn)對(duì§λδ€)于一(yī)些(xiē)具體(tǐ)的(ε×♣✔de)很(hěn)流行(xíng)的(de)分(fēn)析技(jì)術(s •β hù),例如(rú)液相(xiàng)色譜,紫外(wài)±÷光(guāng)譜,除了(le)實驗的(de)一→®£(yī)些(xiē)公共特征,還(hái)δπ★是(shì)有(yǒu)其自(zì)身(shēn)獨≥₩∑有(yǒu)的(de)一(yī)些(xiē)屬性的(de)。通(tōng)過÷ε DTD,大(dà)家(jiā)可(kě)一(yγ≤ī)緻地(dì)使用(yòng)某個(gè)标準的(de) DTD(HP♥&α∏LC,IR) 來(lái)交換數(shù)據。而應用(yòng)程∑≠序也(yě)可(kě)使用(yòng)某個(gè↑♥)标準的(de) DTD 來(lái)驗證從(cóng)外(wài)部₩α§♣接收到(dào)的(de)數(shù)據。同時(shí)還(↓λhái)可(kě)以使用(yòng) DTD¶↔ 來(lái)驗證自(zì)身(shēn)的(de)數(shù)據✔←。
作(zuò)為(wèi)一(yī)種通(tōng)用(yòng)≠'£型的(de)數(shù)據表示方法,An <IML适合于包括光(guāng)譜,色譜,§₩圖像,生(shēng)物(wù)分(fēn)析等各種↕♣π數(shù)據的(de)表示。除了(le)經常使用(yòng)的(ε&de)分(fēn)析儀器(qì)數(shù)據,AnIML也 ✔(yě)可(kě)用(yòng)于新興的(de)數(s&↓$hù)據格式或一(yī)次性的(de)探索性實驗,例如(rú)微>×(wēi)流體(tǐ)芯片或特殊的(de)傳感器(q<↓☆γì)。随著(zhe)技(jì)術(shù)的(de)發展,→↓新的(de)分(fēn)析技(jì)術(shù)和(hé)其相(xiπ♦α×àng)應的(de)技(jì)術(shù)說(s™←♦huō)明(míng)都(dōu)将取得(de)進步≈↓σ 。這(zhè)種通(tōng)用(yòng)性的(de±≈™)方法允許系統繼續使用(yòng)這(zhè)些(xiē)早期的(de)An ε&IML文(wén)件(jiàn),而無需對(du≤ì)軟件(jiàn)進行(xíng)修改或升級。
專有(yǒu)格式 | 通(tōng)用(yòng)格式←<♣/标準格式 |
二進制(zhì) | 基于ASCII碼 (例如±×(rú)XML) |
結構緊湊 | 冗長(cháng) |
快(kuài)速讀(dú)/≥®寫 | 讀(dú)寫慢(màn) |
用(yòng)戶數(shù)據采β✘→集和(hé)處理(lǐ) | 主要(yào)用(yòng)于數(shù)據共享和(h ©é)長(cháng)期保存 |
如(rú)果我們有(yǒu)心好(hǎo)好(hǎo)看(kàn)看¥£ (kàn)AnIML的(de)技(jì)術(s✔>$hù)文(wén)檔,你(nǐ)會(huì)發現(xiàn)AnIML就(ji÷₹€ ù)是(shì)純粹的(de)XML技(≠₩jì)術(shù)。這(zhè)将大(dà)大(dà)降低(dī)我們₩≤↔利用(yòng)這(zhè)一(yī)新技(jì)術(shù)的(d± •e)難度。能(néng)夠讀(dú)取和(hé)解析XML文(wén)檔的(d¥δe)軟件(jiàn)不(bù)勝枚舉。為(wèi¶γ✘)了(le)掃盲,我這(zhè)裡(lǐ)再啰嗦幾句。→™σ↓XML是(shì)完全基于普通(tōng)文(wén)本的(de)。即便存 •₽儲二進制(zhì)表示的(de)圖片,也(yě)→↕會(huì)先将二進制(zhì)轉換為(wèi)字符串再放(fàng)入XM♣Ω←L文(wén)檔中。我們可(kě)以用(yòng)最簡單的♥↔✔£(de)閱讀(dú)工(gōng)具——記事(shì)本查看(kàn)XMLα§π文(wén)檔。想想就(jiù)知(zhī ™)道(dào)這(zhè)是(shì)多(duō)麽美(měi)好( ∑hǎo)的(de)一(yī)件(jiàn)事(shì)情,數(shù)據長• λ(cháng)期存儲的(de)擔心可(kě)以落地(dì)了(le),找不(b×↓ΩΩù)到(dào)原始工(gōng)作(zuò)站(zhàn)軟§₹件(jiàn)的(de)人(rén)也(yě)可(kě)以出口♠÷δ氣了(le)。當然,那(nà)些(xiē)認為(wèi©₹¥♠)可(kě)以更方便修改數(shù)據的(de)人(rén)美(měi)♦β™夢做(zuò)得(de)就(jiù)有(yǒu)點早了π (le)。
1 應用(yòng)AnIML解決現(xiàn)實問(w★≈×Ωèn)題
想想,如(rú)果能(néng)将我們所有(yǒuε™)的(de)分(fēn)析數(shù)據都(dōu)轉變成同樣的(de)格♦ ♥式,許多(duō)實驗室中的(de)共性問(₽∑wèn)題就(jiù)都(dōu)能(né±<&♥ng)得(de)到(dào)解決。
LIMS和(hé)ELN集成:采用(yòng)AnIML數(shù)據格式可(kě♦♦)以使得(de)儀器(qì)中的(de)♣≤數(shù)據更容易方便地(dì)傳輸到(dào)其他(tā)的(de)一™∑σ♥(yī)些(xiē)數(shù)據系統中,例如(rú)LIMS(實驗室信息管÷¶理(lǐ)系統)和(hé)ELN(電(diàn)子₩↑≈Ω(zǐ)實驗記錄本系統)。大(dà)家(jiā)知(zhī≈≠ β)道(dào),不(bù)管是(shì)LIMS還(hái)÷λ是(shì)ELN與儀器(qì)的(de)集成都(dōu)是(sh♦ →ì)這(zhè)類項目實施的(de)一(yī✘βδ)個(gè)難點,既耗錢(qián)又(yòu)費(fèi)力,最終可(k>>ě)能(néng)還(hái)不(bù)討(tǎo)好(hǎo)。∑✔₽☆儀器(qì)種類一(yī)多(duō),因為(wèi)每種儀§∏≠器(qì)的(de)數(shù)據格式都(dōu)不(bù€™>)一(yī)樣,工(gōng)作(zuò)量¥就(jiù)會(huì)成倍增加。有(y∞§ǒu)了(le)AnIML,就(jiù)不☆ ©(bù)再需要(yào)為(wèi)每種儀器(qì)做(zuò)÷±∞"獨立的(de)接口。通(tōng)過數(shù)據标準化(huà),從(cón"✔g)一(yī)個(gè)接口就(jiù)可(kΩ↑ě)以獲取所有(yǒu)儀器(qì)的(de&∑∏<)數(shù)據,既減少(shǎo)了(le)接口的(de)數(sh•δα↓ù)量,也(yě)降低(dī)了(le)集成的(de)成β¥本。
協作(zuò):在許多(duō)行(xíng)業(yè),企業(y♥πè)經常需要(yào)與內(nèi)部或ε"外(wài)部的(de)人(rén)員(yuán)進行(xíng)合作(¶™zuò),特别是(shì)在制(zhì)藥行(xí→₽ng)業(yè)中,外(wài)包業(yè)務的(de)發♣€展更是(shì)如(rú)火(huǒ)如(rúφ≤α)荼。由于雙方使用(yòng)的(de)儀器(qì)和(hé)軟件(↓♣≈βjiàn)有(yǒu)差别,數(shù)據産生(shēngλσ↓)方往往需要(yào)将這(zhè)些(xiē)儀器↓λ≤γ(qì)産生(shēng)的(de)數(shù)據進行(xíng)處理(l&↑±≈ǐ)後生(shēng)成各種電(diàn)子(zǐ)表格或Pdf文(w ×én)件(jiàn)後,再傳遞給合作(zuò)方。↑™傳遞的(de)數(shù)據主要(yào)是(sh↑✔ì)處理(lǐ)後的(de)結果數(shù)據,其中丢失€€很(hěn)多(duō)重要(yào)的(de)原始數(shù)據≠€♣信息。采用(yòng)AnIML标準後的(₽•σ±de)分(fēn)析儀器(qì)原始數(shù)據文(wén≈')件(jiàn)可(kě)以更容易地(dì)交換數Ω€ (shù)據。不(bù)同于傳統的(de)Excel電(↕diàn)子(zǐ)表格和(hé)PDF報(b"₹&ào)告,AnIML使我們能(néng)夠傳輸完整的(de)分(fēn)析數₽∞(shù)據,合作(zuò)方可(kě)以看(kàn)'♣到(dào)完整的(de)原始數(shù)據。≥÷✔這(zhè)既可(kě)以提高(gāo)數(shù)據質量™&λ ,合作(zuò)方也(yě)可(kě)對(duì)這∑♦'(zhè)些(xiē)數(shù)據進行(xíng)再分(fēn)析,提高(π§±gāo)數(shù)據的(de)利用(y₩βòng)率。
長(cháng)期數(shù)據保存,在受監管的(de)行(xíng)業(yè)裡(lǐ)(例如(rú)&¥制(zhì)藥行(xíng)業(yè)),分(fπεēn)析數(shù)據的(de)保存一(yī)直是(shì)σ♦"≤一(yī)個(gè)難以解決的(de)問(wèn)↕±題。原因主要(yào)在于數(shù)據所需要(yào)保存÷≠→的(de)時(shí)間(jiān)較長(cháng),甚至達數(sh<₹ù)十年(nián)。數(shù)十年(nián)的(de)≠&時(shí)間(jiān)對(duì)于IT技(jì)術(shù)來¶←(lái)講,可(kě)能(néng)會(huì ≥ $)發生(shēng)天翻地(dì)覆的(de)變化(h×π©☆uà)。同樣對(duì)于儀器(qì)配套的(de)軟件(jiàn)來αφ(lái)說(shuō),其也(yě)會(hu≈∑ì)經曆無數(shù)個(gè)版本的(de)升 ↑級。更為(wèi)關鍵的(de)是(shì),即便"β'€解決軟件(jiàn)的(de)問(wèn)題,其讀(dú)取數(shù)據↔♠的(de)基礎環境也(yě)會(huì)發生(shēng)變化(h♦ uà),例如(rú)該軟件(jiàn)所适合的↔¥(de)操作(zuò)系統。要(yào)在幾十年(ni÷δφεán)裡(lǐ)為(wèi)某一(yī)類原始"↔♦數(shù)據保存一(yī)個(gè)讀π>(dú)取的(de)環境似乎不(bù)太合乎實際,尤其是(shì)在儀器(← £qì)種類和(hé)數(shù)據種類比較多(duō)的(↓©de)情況下(xià)。将這(zhè)些(xiē)數↓•(shù)據轉換為(wèi)AnIML可(kě)能(n§✘✔éng)是(shì)一(yī)個(gè)好(hǎo)的(de)解決辦法。¶≤此舉能(néng)大(dà)為(wèi)減少(shǎo)所需要(yào)的∞≤(de)配套軟件(jiàn)工(gōng)具,也(↑yě)不(bù)會(huì)受到(dào)基礎環境的(de)制(zhì)約,§©$∞很(hěn)自(zì)然會(huì)減少(shǎo)一(yī)個(gè)♥★γ信息系統的(de)運行(xíng)成本。
數(shù)據分(fēn)析和(hé)報(bào)告:通(tōng)常情況下(xià),采集和(hé)處理(lǐ)分(fēn₩α€)析數(shù)據僅僅是(shì)第一(yī)步。我們看(kàn)到(dà§♦o)各種數(shù)據驅動的(de)工(gōng)作(zuò)流應用(₹β&↕yòng)在不(bù)斷增加。這(zhè)些(xiē)數(shù)據流方法♥₹在數(shù)據源頭上(shàng)在不(bù)斷下(xi§≤'à)探,逐步深入到(dào)原始數(shù$÷✘☆)據,并進一(yī)步對(duì)這(zhè)些(xiē)數Ω¥≤(shù)據集應用(yòng)可(kě)∑✘視(shì)化(huà),實驗設計(jì),多(duō)ε✔£變量分(fēn)析等統計(jì)學工(gōng)具進行σσδ™(xíng)數(shù)據分(fēn)析。通(tōng)過AnIML± §→歸一(yī)化(huà)的(de)原始數(shù)據将會(huì)使得(de)↑∞為(wèi)這(zhè)些(xiē)流程提供數(shù)據變 ' ₹得(de)更加簡單。
但(dàn)這(zhè)世界上(shàng)沒有(yǒ↑γ↑u)免費(fèi)的(de)午餐,我們需要♣→¶(yào)有(yǒu)能(néng)夠将原來(lái)儀器(qì)格♠≈式的(de)數(shù)據轉換為(wèi)AnIML格式的(de)工 ε♠↑(gōng)具,還(hái)得(de)有(yǒu"π☆€)能(néng)夠查看(kàn)AnIML格式數(shù)據的(de)工(≤π®♦gōng)具。
為(wèi)了(le)建立AnIML,大(dà)家(jiā®₹)花(huā)了(le)很(hěn)長(c×≤háng)的(de)時(shí)間(jiān),這(z←≤←>hè)裡(lǐ)面不(bù)單是(shì)技(jì)術(shù)性的(de)問Ω≠×(wèn)題,還(hái)與一(yī)些(xiē)非技(jì)術(shù)性∏∏的(de)因素。分(fēn)析實驗室雖小(xiǎo),利益相(xiàng)關ε©¶®者卻衆多(duō)。到(dào)目前為(wèi)止,AnIβγML的(de)技(jì)術(shù)性的(de)工(gōn←₹g)作(zuò)早已完成,大(dà)家(ji≠₹ā)可(kě)以放(fàng)心使用(yòng)。經過ASTM表決 ₽之後,AnIML将成為(wèi)一(yī)個(gè)開(kāi)放(σ>♠→fàng)的(de)公共的(de)标準。與此同時(shí),真γ≤正施行(xíng)這(zhè)個(gè)标準所需要(yào★¥©)的(de)工(gōng)具的(de)開(kāi)發早已λ✘λ®走在了(le)前面。對(duì)于終端用(yòng)戶來(lái)說(sh©β₹uō),桌面版的(de)AnIML數(shù)據查看(kàn)工(gōng)具≠<¥,Web和(hé)移動平台,集成工(gōng)具,數(shù)據轉換>器(qì)都(dōu)已經有(yǒu)現(xiàn)≤±成的(de)了(le)。對(duì)于供應商來 ±(lái)說(shuō),在他(tā)們現ε ™(xiàn)有(yǒu)的(de)儀器(qì)軟件×$↑→(jiàn)中嵌入AnIML功能(néng)也(yě)并非難事(shì)。
上(shàng)一(yī)條:電(diàn)子(zǐ)實驗記錄系統實施——之業(y ∏è)務分(fēn)析篇
下(xià)一(yī)條:構建符合21 CFR Part11的(de)安全控制(zhì)機(jγ©ī)制(zhì)