本刊記者 黃 健
王偉業:信息助力生物樣本庫
本刊記者黃健

辦公室工作照
在這個世界上,有一種“銀行”,它儲存的并不是物質財富,卻是比金錢更珍貴的東西——健康財富,這一“銀行”就是生物銀行,通常稱為生物樣本庫。生物樣本庫被世界各國公認為最有意義的“銀行”。它不僅代表了生物醫藥領域的核心競爭力,還體現了一個國家的醫療水平。
近年來,中國的生物樣本庫事業發展飛速,但與歐美等發達地區和國家比起來,仍存在很多問題。值得慶幸的是,在中國追趕世界的進程中,有一批為推動中國生物樣本庫事業發展盡心竭力的人,歸國助力的王偉業就是其中典型的一員。
2009年6月4日,中國醫藥生物技術協會組織生物樣本庫分會得到衛生部、民政部批復成立,這一事件被很多人視為中國生命科學研究、生物醫藥研發史上的里程碑事件。
彼時,正在大西洋彼岸美國的王偉業已經將興趣投在樣本庫信息化發展方向。早在20世紀80年代末就跨出國門的他,先后在美國貝勒醫學院、美國著名的輝瑞醫藥公司和美國威斯康星醫學院等地深造和工作,在生物樣本庫方興未艾的時候就早早地介入到這一行業中,置身國際潮流前端,親身經歷和見證了這一行業的成長和發展,并積累了寶貴的經驗財富。憑借敏銳的洞察力,他感受到了中國在相關領域蓄勢待發的勇氣和決心。
于是在2012年,迎著國內生物樣本庫技術蓬勃發展的春風,在人才緊缺之時,王偉業義無反顧地回到祖國,作為國外引進的樣本庫信息化管理專家,加盟上海交通大學醫學院,并作為轉化醫學研究院“985工程”生物樣本庫建設首席咨詢專家,指導多家生物樣本庫建設工作,而他的工作重心,就是推動生物醫學科研信息和生物樣本庫信息化發展,促進資源信息共享。
“生物樣本不管儲存有多大和多好,如果沒有相應的信息,亦如空殼,幾乎沒有什么價值。一家信息管理做不好的樣本庫,亦如‘死庫’,只能是浪費資源。”王偉業一語道破了自己關注生物樣本庫信息化的原因,而他所強調的信息化是運作管理信息化之外的樣本信息化。
“現在國內業內人士在參觀評價某個生物樣本庫時,總是以空間有多大,有多少冰箱,用什么儀器,有幾個人,發了多少篇論文等來衡量樣本庫建設的好壞,信息化程度卻很少有人關注。其實真正能夠展示一個樣本庫價值的只有信息,一個有價值和管理規范的數據庫才是能夠物盡其用”。在國外從事相關行業多年,王偉業深刻體會到信息化之于一個現代生物樣本庫的重要性,回國后更是有感于國內在相關領域的欠缺,因而多方奔走,振臂高呼,盡心竭力終換來了行業面貌的改善和眾人的逐步認可。
“其實,中國與國外相比并不是只有差距更有優勢,中國這幾年在相關行業里得益于一批領軍人物卓有成效的工作,加之越來越多中堅力量和年輕人的加入,事業發展迅速,其樣本資源的豐富是任何一個國家無可比擬的:有些疾病的病例數在我國一個月的就診數量就相當于國外幾個月積累,而整個歐洲的例數甚至可能少于我國一家三甲專科醫院。”
在行業里摸爬滾打多年,經歷多了,認識也變得深刻,王偉業將國內外相關領域的差距歸結為:認識(理念)、模式、機制三方面的不足。認識方面除了上文提到的評價樣本庫建設好壞的標準偏差之外,還有很多譬如文化上的差異,導致樣本庫利用率不高、缺乏系統化的認識、設計和沒有考慮好資源應用等,這些認識上的不足影響了模式和機制的發展。
“我個人認為模式不用擔心,國外有好的生物樣本庫發展模式,我們可以借鑒與借用,再改良為適合我們的可行性模式,但機制不能借用,需要在我們的環境下適應性地產生。目前,我國生物樣本庫仍是分散、獨立、無序的狀態,各單位一直傾向于單兵作戰為主流。在建設設計上都會包括整合與共享的目標,但是對共享方式的理解等同于是否給他人用自己擁有的資源,換句話說,還包括是否有合適或可以接受的利益交換為主導的理解。現實中可能大多還是采取防守的態度來回避這個問題,從而影響了共享模式和機制的探索。其實共享首先是系統資源的交流,也就是1+1之后可以共享2,而不是簡單地兩個1之間是否可以某種方式各自利用或者交換。那么明確地說關鍵是這兩個1能否合并整合為一個新的資源而雙方共同應用”。運作模式和機制的確立和完善是王偉業眼中中國生物樣本庫發展的瓶頸之一。
是閉關自守還是開放共贏?現代生物樣本庫的發展無疑應該選擇后者,而信息化是帶動中國生物樣本庫走向實質轉變的引擎。王偉業深諳此意,為此他將這股國際前沿之風帶回了中國,值得一提的是,他所倡導的信息化并不是一味照搬,而是充分考慮國內外優劣勢的,屬于中國自己的特色之路。這條路并不好走,因而他步步為營,走得堅定而扎實——

訪問美國NCI的Dr.Marston Linehan教授
雖然回國的時間并不算很長,但是王偉業這幾年穩扎穩打,做了不少卓有成效的工作。
他基于自己的研究與研發興趣綜合性歸納形成的系統性生物樣本建設和運作理念,可以簡單地概括為10個要素:信息化運作和管理樣本庫,了解相關疾病或健康信息,應用臨床信息表達生物樣本的生物特性,明確信息質量也是生物樣本質量要素,以語義化方式描述生物特性,統一信息數據元素,基于臨床電子化病歷的信息應用,生物信息學必須結合臨床信息,臨床醫生與科研人員之間的團隊(Team-up)和技術+平臺結構。
這幾年以來,王偉業除了領導研發合作團隊研發信息化管理系統,也作為技術負責人指導研發信息化共享平臺,而他和他的團隊走出的較關鍵性的一步就是建立統一信息管理系統。
2013年,他領導的IT合作團隊完成了生物樣本庫信息化管理系統(BIMS系統)的建立,佐證了其力求打造統一、標準化信息化管理系統的決心和基礎。BIMS系統目前已在多家樣本庫建設和管理者發揮作用。為進一步提高生物樣本庫信息化管理的需要,不久前,王偉業按照計劃完成了新版本BIMS的設計和初期研發的研發,并取名為NGBIMS,體現為新一代的BIMS,并強調BIMS深意并不是字面上反映的那樣(Biobank Information Management System),而是強調樣本信息化的主題,即Biological Information Makes Samples——信息內涵決定了生物樣本的價值。這一解釋進一步強化了樣本的真正價值在于其內涵的信息。
“樣本庫的發展,首先要建立,然后才能統一,也必須統一,最后才有可能發展為樣本資源網絡,這是國際樣本庫發展趨勢中的三個里程碑。但是這里的‘統一’,并不是把資源放在一起整合儲存那么簡單,而應該是相同的資源在應用時具備相容性,可以用同一個標準和方式來評價其質量、價值和特性等。另外‘網絡’也并非計算機網絡那么簡單,網絡代表共享,包括信息和樣本資源統一后的共享。”“信息交流越先進越好,最終理想是對同源信息能夠有一致的/統一的(Harmonization)信息內容和采集方法,這才是需要的標準……”王偉業眼中,無論是數據的統一、樣本資源網絡的建立還是其他,他需要做的事情雖然細分為很多項,但是都是相互關聯、相輔相成的。
強調生物信息應并面向應用是他關注的又一重要領域。“生物樣本庫的信息如果不考慮應用,將永遠不能用于改善臨床,發揮實際效用。舉個通常的例子:現在我們的樣本庫主要以臨床診斷作為樣本的主要信息,比如某種腫瘤的臨床診斷名稱,而個體信息可能不全或不正確,收集了這些群體生物樣本之后,只描述臨床診斷是某種型肺癌,如果研究者是想用此樣本來研究吸煙和肺癌發生的相關性,但是樣本提供者的信息可能只是抽煙,但是其他相關信息都沒有,何況與吸煙相關的參數多到好幾十。這種情況或者說不全面和不正確的信息使研究人員無法確定樣本資源是否能夠符合研究需要,因此樣本信息就無法得到很好的應用,這與我們相關行業的發展現狀有關。”
據王偉業介紹,國外相關技術研究講到應用很多是大型跨國醫藥公司在做,他們的應用方向很明確,我國則是以科研為主,科研和企業比較全面合作的少,這局限了生物樣本庫的應用。目前,他本人以信息化應用為主題的項目采用產學研結合的企業間合作和國際合作。
回國后,王偉業一直致力于利用自己多年積累的經驗、人脈帶動相關領域合作。近期,由他負責申報的兩項信息化國際合作科研項目,已經獲得上海科委國際合作項目和國家科技部國際科技合作專項的立項經費支持。項目的主要目的是探索應用統一多方數據元素的方法和數據屏蔽技術,建設信息共享機制和運作模式,促進國內國際合作研究。
譬如他所工作的新華醫院開展了建設生命早期生物樣本資源庫工作,包括孕婦,新生兒和兒童隨訪的生物樣本和相關信息資源,其基本目的是建設綜合性的研究資源,由同一個研究資源開展不同方向的研究,兒童臨床疾病研究可以在需要時追溯其胎兒期的生物樣本和信息資源,有利于探索病因學研究。除此之外,他還規劃開展關于臨床電子病歷信息應用于臨床研究,“應用臨床電子病歷作為臨床信息資源面臨著兩大主要問題,一是信息不全;二是信息可能不正確,所以完全依賴臨床電子病歷的信息開展臨床研究定會存在著問題,我們應當采用國外臨床相關的方式——專門補充臨床研究的信息,將臨床疾病信息庫建立成臨床研究信息庫。”

與前來新華醫院生物樣本庫學習的人員合影
“2015年初我去美國NIH的腫瘤研究所(NCI)拜訪一位著名外科醫生和研究者,獲得的體會很深”王偉業說。通過建立完善的電子病歷,研究者可以更容易地通過數據分析招募符合歸納入組條件的病人,把樣本人群按研究設計分類分組開展研究。值得一提的是,這樣的病歷最好也應該建設成為能夠為病人自己使用,可以進行個人健康和疾病恢復縱向比較,自身的健康狀況和變化應該是最好的對照。”王偉業補充說。
除了國際間合作,國內各樣本庫之間的協作與聯盟也是王偉業極力倡導的。“現在很多大小醫院為順應發展趨勢都爭相建立樣本庫,特別是小醫院由于科研平臺薄弱、缺乏資金和人力資源支持,最后可能發展為傳統上的一個實驗室有幾個冰箱模式。一個全面自動化的平臺可以在保證質量的前提下,完成相同的流程式操作,但資金分配后導致任何一家單位都承擔不起,即使購買了設備,所需的試劑與耗材也會缺乏資金,或者有了設備,卻因為本單位沒有那么多需求而閑置,造成資源浪費。就像把需要一個拳頭力量來做的事情分成單個手指去單獨執行。”王偉業說。而解決統一和共享等方面認識和技術方面的系列問題,都是在為協作和聯盟鋪路。
與此同時,為樣本庫建設下一階段的發展考慮,王偉業計劃在條件許可的情況下,開展研究樣本庫信息資源的語義化描述/注解、語義化索引以及樣本庫資源語義化檢索等方面的工作,為建設語義化的信息樣本庫做些探索性研究。他相信臨床信息的應用將來必然會朝此方向發展,滿足臨床研究和生物樣本庫的應用需要。通過語義化注解,樣本資源不但可以在信息表達方式上統一,同時更具專業和表達的邏輯性。可以通過一定的統計學分析來評估樣本信息質量和相互之間的可比性和相似性,為判斷資源共享的合理性提供一個可分析的方法。
大到平臺系統的建立,小到關注樣本庫信息采集內容和方式……現在的王偉業,每天就像是一個不停轉的陀螺,有很多事情要做,雖然很辛苦,但令他感到欣慰的是,越來越多人認識并認可臨床信息對現代生物樣本庫建設與發展的重要性,一支越來越專業的生物樣本庫建設和管理人才正在我國形成,也有越來越多志同道合的人加入其中,形成行業之勢——
“我們現在需要的人員構成用個通俗的詞語來形容就是‘混搭’,因為樣本庫涉及的知識范圍很廣,包括醫學、生物學,分子生物學、冷凍保存技術、生物信息學和信息化管理學等,需要多學科交叉。現在國內對樣本庫信息化管理方面的認識還不夠全面,很容易把一些問題歸納為計算機信息技術的問題。其實有不少需求或者問題不一定是計算機信息方面的問題,如樣本庫的信息標識,信息注解等,不能夠只依賴IT方面人員,而是需要樣本庫工作人員去做。但從另一方面來講,現在生物醫學研究離不開數據收集,離不開信息化管理,數據處理、生物樣本信息處理,完全用Excel格式或手工記錄已經不能滿足現代生物醫學研究所產生的數據量和復雜性方面的需求,所以不少做分子生物研究的人,因為工作需要而去鉆研信息相關方面的知識與技能。以我多年的工作經歷和體會來看,我深感自己多年在生物信息化方面的積累加上我自己對計算機領域知識的愛好,跨學科知識與技能對我幫助很大……”
走過國內外很多相關學科研究殿堂以及實踐的前沿陣地,王偉業早已習慣了將人生中的各種經歷轉化為自身寶貴的財富,并將這些精華細心收藏留作后用。
直到今天,他還一直對那些走過的路和那些遇到的人念念不忘:幼時一位樂于學習英文的好朋友影響他早期認識自身在英語方面的不足,促使他很好地掌握這一門與人溝通的工具,從此他有了更多與各種人溝通交流的機會;跨出國門后,他的研究生導師教他學會了如何提出問題以及思考問題,從此這一思維方式成了他開啟科學研究大門的鑰匙;而在貝勒醫學院時曾經與美國斯坦福大學一位教授的一番對話,則讓他學會了“要想做一件事情,首先要想到自己能不能做,先假設其他條件都滿足的情況下,自己是否知道具體怎么做,而不是盲目地先抱怨沒有環境條件等理由”,從此這一做事方式成為他通向成功的墊腳石……
“機遇總是會留給有所準備的人。”這句話用在王偉業身上再合適不過。多年前作為一名普通的留學生,他所學的專業原本只是生物化學和分子生物學,“那時我們做序列分析都是用手工做的,十幾個KB的序列都是用眼睛讀片子讀出來的。”切身的辛苦體會讓王偉業在網絡計算機分析工具剛剛興起的時候就對這一新鮮事物產生了濃厚的興趣,因而逐步轉向生物信息學,為他走在學科潮流前端奠定了基礎。
之后,王偉業在大型跨國制藥公司的經歷中管理和經歷工作流程規范方面歷練了自己,而他與生物信息真正結緣的轉折就是在這里開始的:當時很多人都是先學了計算機再學生物信息學,而他是借用自己工作時候的興趣和自己工作的需要,作為既是生物學博士又掌握計算機知識的研究人員,有了從事生物信息學相關工作的機會。“既保證自己不離開生物醫學這一主流,又能滿足我運用計算機知識和技術方面的興趣。”這是王偉業最理想的職業方向,且工作性質也十分符合他喜歡交流的性格。“人不可以放棄選擇,但是可以選擇放棄。”王偉業從不讓機會在自己身邊溜走,贏得了機會,也贏得了自己。
至今,王偉業依然感念國外多年對自己造成的影響,一是接觸面的廣泛;二是做事方式的培養。走過的路越多,他越能體會到經歷是一種財富,正是這些寶貴的過程,幫助他完成了人生的蛻變。如今,回到中國的他也很想把自己多年的經驗體會與年輕人分享后來人。以自己多年的親身經歷告訴他們該如何提出問題、思考問題,做事要注意思維方式;也告訴他們做事情之前首先要想到自己能不能做,具體怎么做……多年前他曾受益于這些財富的積累,多年后他將這些財富毫無保留地傳給年輕人。
為帶動一批生物樣本庫的年輕人成長,這幾年來,王偉業致力于人員的培訓,與以往主要采取學習班的方式不同,他倡導的是以進修的方式來達到掌握技能和管理的方式,“通過在實際工作中如果遇到問題,學習正確的思考和解決問題的方法是最重要的。通過做事,才能真正知道如何解決問題,才能把一套知識學會。目前在我的團隊,我對他們的要求就是以‘進修’的方式,直接參與到日常工作中去……”
做專職易,做專業難。對王偉業來說,在中國的生物樣本庫信息化的發展之路任重而道遠,技術人員的培養只是一方面。可幸的是,不管是認識、模式還是機制,近幾年來都得到了極大的改善,盡管仍在路上,但他有理由相信,信息時代下的中國生物樣本庫必將不辱使命。