清華電子系研究生肖善譽(yù)等在ICDAR 2019國(guó)際會(huì)議上獲獎(jiǎng)
清華新聞網(wǎng)10月15日電 近日,清華大學(xué)電子系2019級(jí)碩士生肖善譽(yù)和2017級(jí)博士生閆睿劼在第15屆國(guó)際文檔分析與識(shí)別國(guó)際會(huì)議(ICDAR 2019)上發(fā)表論文“基于像素級(jí)矯正與穩(wěn)健訓(xùn)練深度網(wǎng)絡(luò)的手寫(xiě)文字識(shí)別”,并獲得ICDAR 2019 “Best Student Paper Runner-Up Award”。論文作者為電子系的碩士生肖善譽(yù)、副教授彭良瑞、博士生閆睿劼和教授王生進(jìn)。肖善譽(yù)、閆睿劼和導(dǎo)師彭良瑞副教授出席了日前在澳大利亞悉尼召開(kāi)的ICDAR 2019會(huì)議。論文第一作者肖善譽(yù)在會(huì)議上作口頭報(bào)告,并在報(bào)告后的問(wèn)答環(huán)節(jié)回答了與會(huì)專(zhuān)家的提問(wèn)。

ICDAR 2019會(huì)議主席Michael Blumenstein教授(右)為肖善譽(yù)(左)頒獎(jiǎng)
ICDAR 是國(guó)際模式識(shí)別學(xué)會(huì)主辦的文字識(shí)別領(lǐng)域規(guī)模最大的國(guó)際學(xué)術(shù)會(huì)議,自1991年起,每?jī)赡昱e辦一次。ICDAR 2019論文投稿總數(shù)為403篇,論文口頭報(bào)告錄用52篇,錄用率約為13%,另有176篇論文張貼報(bào)告錄用,參會(huì)人數(shù)為500多人。

ICDAR 2019 “Best Student Paper Runner-Up Award”證書(shū)
手寫(xiě)文字識(shí)別是一種將手寫(xiě)文檔圖像轉(zhuǎn)換為可全文檢索文本的人工智能技術(shù),是文字識(shí)別領(lǐng)域具有挑戰(zhàn)性的經(jīng)典課題。深度神經(jīng)網(wǎng)絡(luò)是當(dāng)前機(jī)器學(xué)習(xí)領(lǐng)域的主流技術(shù)。對(duì)于書(shū)寫(xiě)風(fēng)格變化大和訓(xùn)練標(biāo)定樣本數(shù)量有限的手寫(xiě)文字,如何設(shè)計(jì)深度網(wǎng)絡(luò)尋求穩(wěn)定的特征表示,并且提高模型在測(cè)試樣本上的泛化能力是至關(guān)重要的問(wèn)題。論文在特征提取層面引入一種基于卷積神經(jīng)網(wǎng)絡(luò)的像素級(jí)筆畫(huà)形變矯正方法,并引入多種正則化穩(wěn)健訓(xùn)練策略,最終在英文、法文、阿拉伯文三個(gè)國(guó)際公開(kāi)手寫(xiě)文字樣本集上取得全面優(yōu)于文獻(xiàn)已有報(bào)道方法的結(jié)果。這一研究成果對(duì)于自然場(chǎng)景圖像文字識(shí)別等其他研究課題也具有借鑒意義。
供稿:電子系
編輯:周襄楠