清華大學(xué)丁曉青團(tuán)隊(duì)“高性能維吾爾文識(shí)別和理解系統(tǒng)”通過(guò)專(zhuān)家鑒定
清華新聞網(wǎng)12月3日電 困擾業(yè)界多年的維吾爾文識(shí)別和維漢翻譯理解問(wèn)題,被清華大學(xué)丁曉青教授所帶領(lǐng)的科研團(tuán)隊(duì)攻克。12月1日,由教育部組織在北京清華大學(xué)召開(kāi)的 “高性能維吾爾文識(shí)別和理解系統(tǒng)”科技成果鑒定會(huì)上,鑒定委員會(huì)主任、中國(guó)工程院院士倪光南宣布:清華大學(xué)丁曉青教授科研團(tuán)隊(duì)首次實(shí)現(xiàn)了維吾爾文無(wú)切分識(shí)別并創(chuàng)建了維漢識(shí)別理解一體化系統(tǒng),總體達(dá)到國(guó)際領(lǐng)先水平。
.jpg)
維吾爾文識(shí)別及維漢對(duì)照關(guān)鍵詞檢索單機(jī)版系統(tǒng)界面。
自2011年起,在國(guó)家自然科學(xué)基金重點(diǎn)項(xiàng)目支持下,清華大學(xué)電子工程系在連寫(xiě)民族文識(shí)別問(wèn)題上深入鉆研??蒲袌F(tuán)隊(duì)摒棄了原有的基于字符切分的維吾爾文識(shí)別方法,在基于隱含馬爾可夫模型的無(wú)切分維吾爾文識(shí)別技術(shù)上進(jìn)行了創(chuàng)新,提出了維漢對(duì)照關(guān)鍵詞檢索的跨語(yǔ)言理解方式。同時(shí)由新疆大學(xué)信息科學(xué)與工程學(xué)院院長(zhǎng)吐?tīng)柛?bull;依布拉音教授帶領(lǐng)團(tuán)隊(duì)負(fù)責(zé)研發(fā)維漢全文翻譯技術(shù),北京文通科技有限公司負(fù)責(zé)實(shí)現(xiàn)系統(tǒng)架構(gòu)和網(wǎng)絡(luò)服務(wù)平臺(tái),最終研制成功“高性能維吾爾文識(shí)別與理解系統(tǒng)”。
據(jù)課題組成員、清華大學(xué)電子系彭良瑞副教授介紹,維吾爾文是不同于漢字和拉丁文字的拼音文字,其外形和結(jié)構(gòu)的變化很大,單詞內(nèi)字符連寫(xiě),且相似字不易辨別,為維吾爾文識(shí)別帶來(lái)相當(dāng)?shù)睦щy。
“這一系統(tǒng)首次實(shí)現(xiàn)無(wú)切分連寫(xiě)維吾爾文識(shí)別,并在統(tǒng)一系統(tǒng)框架中首次實(shí)現(xiàn)了維吾爾文識(shí)別和翻譯理解無(wú)縫連接,解決了維吾爾文的文檔經(jīng)掃描圖像識(shí)別輸入計(jì)算機(jī)以及以漢語(yǔ)為目標(biāo)語(yǔ)言的跨文種輸出難題。”彭良瑞說(shuō)。

鑒定會(huì)現(xiàn)場(chǎng)。
據(jù)介紹,該系統(tǒng)可廣泛應(yīng)用于維吾爾文辦公自動(dòng)化、電子出版、互聯(lián)網(wǎng)信息資源建設(shè)。這一科研成果的取得為我國(guó)新疆地區(qū)的民族文字文檔建立開(kāi)辟了先進(jìn)的數(shù)字化大道,并且加強(qiáng)了以漢語(yǔ)為目標(biāo)語(yǔ)言的跨文種交流方式,有利于促進(jìn)民族文化交流。
鑒定會(huì)上,清華大學(xué)電子工程系主任黃翊東教授在會(huì)議開(kāi)始時(shí)致辭。國(guó)家自然科學(xué)基金委信息學(xué)部張兆田副主任、信息科學(xué)一處熊小蕓處長(zhǎng)和宋朝暉項(xiàng)目主任也出席了會(huì)議。教育部語(yǔ)言文字信息管理司張浩明司長(zhǎng)、國(guó)家民委教育科技司周曉梅副司長(zhǎng)在會(huì)后總結(jié)發(fā)言,強(qiáng)調(diào)了民族文字信息化在國(guó)家發(fā)展及安全中的戰(zhàn)略地位。
視頻新聞?wù)堻c(diǎn)擊:http://tv.tsinghua.edu.cn/mcms/?p=5379
供稿:電子系 編輯:蕾蕾