清華新聞網(wǎng)11月26日電 11月22日-23日,深圳市福田區(qū)人民政府、深圳市福田區(qū)科技創(chuàng)新局和粵港澳大灣區(qū)數(shù)字經(jīng)濟(jì)研究院(International Digital Economy Academy,簡(jiǎn)稱(chēng)“IDEA”)聯(lián)合舉辦IDEA大會(huì)。IDEA創(chuàng)院理事長(zhǎng)、美國(guó)國(guó)家工程院外籍院士、英國(guó)皇家工程院外籍院士、清華大學(xué)雙聘教授沈向洋在會(huì)上發(fā)布了由清華大學(xué)統(tǒng)計(jì)學(xué)研究中心俞聲副教授團(tuán)隊(duì)與粵港澳大灣區(qū)數(shù)字經(jīng)濟(jì)研究院聯(lián)合開(kāi)發(fā)的大型開(kāi)放醫(yī)學(xué)知識(shí)圖譜(Biomedical Informatics Ontology System,簡(jiǎn)稱(chēng)“BIOS”)。

沈向洋在BIOS發(fā)布會(huì)現(xiàn)場(chǎng)講解
醫(yī)學(xué)知識(shí)圖譜是一種由生物醫(yī)學(xué)概念名稱(chēng)、概念分類(lèi)、概念間關(guān)系以及相應(yīng)的ID系統(tǒng)構(gòu)成的特殊數(shù)據(jù)庫(kù),用于支持醫(yī)學(xué)自然語(yǔ)言處理、人工智能建模以及行業(yè)數(shù)據(jù)交換,是醫(yī)學(xué)大數(shù)據(jù)與人工智能領(lǐng)域最重要的基礎(chǔ)設(shè)施之一,對(duì)于行業(yè)發(fā)展具有戰(zhàn)略影響。美國(guó)國(guó)立衛(wèi)生院國(guó)家醫(yī)學(xué)圖書(shū)館于1986年開(kāi)發(fā)并發(fā)展至今的一體化醫(yī)學(xué)語(yǔ)言系統(tǒng)(Unified Medical Language System,簡(jiǎn)稱(chēng)“UMLS”)是目前最權(quán)威的英文醫(yī)學(xué)知識(shí)圖譜,為英語(yǔ)國(guó)家醫(yī)學(xué)大數(shù)據(jù)技術(shù)與產(chǎn)業(yè)的發(fā)展作出了卓越貢獻(xiàn)。而長(zhǎng)久以來(lái),中文領(lǐng)域缺少大型開(kāi)放醫(yī)學(xué)知識(shí)圖譜,是我國(guó)醫(yī)療大數(shù)據(jù)與人工智能產(chǎn)業(yè)發(fā)展的主要制約因素之一。

BIOS知識(shí)圖譜包含的實(shí)體和關(guān)系數(shù)量的描述

基于BIOS知識(shí)圖譜的醫(yī)學(xué)命名實(shí)體識(shí)別演示
為解決中文領(lǐng)域開(kāi)放醫(yī)學(xué)知識(shí)圖譜的缺失,并在國(guó)際范圍內(nèi)進(jìn)一步提升醫(yī)學(xué)知識(shí)圖譜的建設(shè)水平,俞聲帶領(lǐng)團(tuán)隊(duì)進(jìn)行了長(zhǎng)達(dá)五年的技術(shù)攻關(guān),先后開(kāi)發(fā)了基于圖分割與深度學(xué)習(xí)的中文電子病歷無(wú)監(jiān)督多粒度分詞及術(shù)語(yǔ)提取、知識(shí)決定的醫(yī)學(xué)術(shù)語(yǔ)向量化及正則化、高通量醫(yī)學(xué)關(guān)系提取、生物醫(yī)學(xué)自動(dòng)翻譯等技術(shù),為數(shù)據(jù)驅(qū)動(dòng)的大規(guī)模圖譜自動(dòng)構(gòu)建建立了基礎(chǔ),并于2020年11月與IDEA研究院沈向洋院士團(tuán)隊(duì)達(dá)成合作。在領(lǐng)先算法、強(qiáng)大算力和超大規(guī)模語(yǔ)料數(shù)據(jù)的支持下,僅用短短一年時(shí)間,雙方團(tuán)隊(duì)便從原始底層醫(yī)學(xué)術(shù)語(yǔ)開(kāi)始,建立了全新的具有完整自主知識(shí)產(chǎn)權(quán)的中英文雙語(yǔ)醫(yī)學(xué)知識(shí)圖譜BIOS,其規(guī)模整體接近現(xiàn)有權(quán)威知識(shí)圖譜UMLS,并在內(nèi)容質(zhì)量上形成多點(diǎn)超越。
BIOS目前已在線(xiàn)發(fā)布(http://bios.idea.edu.cn)。同時(shí),秉承全面提升發(fā)展中國(guó)醫(yī)療大數(shù)據(jù)與人工智能行業(yè)的開(kāi)放理念,BIOS擬于近期以CCBY-NC-ND協(xié)議開(kāi)放完整數(shù)據(jù)下載。
未來(lái),清華大學(xué)統(tǒng)計(jì)學(xué)研究中心將與IDEA研究院以及更多國(guó)內(nèi)頂尖醫(yī)院合作,不斷擴(kuò)充BIOS的內(nèi)容并完善其質(zhì)量。這不僅將使我國(guó)醫(yī)療大數(shù)據(jù)與人工智能產(chǎn)業(yè)的基礎(chǔ)得到全面提升,也將輻射國(guó)際,帶動(dòng)全球行業(yè)共同發(fā)展。
供稿:工業(yè)工程系
編輯:陳曉艷
審核:呂婷