太阳城集团娱乐球赛-澳门太阳城集团周焯华老婆-澳门太阳城集团车模-豪胜娱乐城客户端

清華主頁(yè) - 清華新聞 - 學(xué)術(shù)科研 - 正文

清華大二本科生在人工智能頂級(jí)國(guó)際會(huì)議發(fā)表論文

清華新聞網(wǎng)4月25日電 4月17日,清華大學(xué)計(jì)算機(jī)系孫茂松教授研究組的論文 “字符與詞匯表示的聯(lián)合學(xué)習(xí)模型”(Joint Learning of Character and Word Embeddings)被人工智能領(lǐng)域頂級(jí)會(huì)議“人工智能?chē)?guó)際聯(lián)合大會(huì)”(International Joint Conference on Artificial Intelligence,IJCAI 2015)接收。該研究成果由劉知遠(yuǎn)和孫茂松老師聯(lián)合指導(dǎo),由計(jì)算機(jī)系二年級(jí)本科生徐磊與計(jì)算機(jī)系博士生陳新雄合作完成,徐磊與陳新雄為論文共同第一作者。這是計(jì)算機(jī)系首次有大二本科生以第一作者身份在頂級(jí)國(guó)際學(xué)術(shù)會(huì)議發(fā)表論文。

徐磊同學(xué)在大一下學(xué)期通過(guò)計(jì)算機(jī)系學(xué)術(shù)新星計(jì)劃加入孫茂松教授研究組從事詞匯表示學(xué)習(xí)研究,通過(guò)一年的不懈努力,與陳新雄合作取得了該研究成果。論文探索了利用漢字信息增強(qiáng)中文詞匯表示學(xué)習(xí)能力的方法,對(duì)中文深度計(jì)算相關(guān)技術(shù)發(fā)展具有參考價(jià)值。

詞匯表示旨在研究如何在計(jì)算機(jī)中結(jié)構(gòu)化地表示詞匯語(yǔ)義信息。伴隨大數(shù)據(jù)時(shí)代的來(lái)臨,如何從大規(guī)模文本數(shù)據(jù)中自動(dòng)學(xué)習(xí)詞匯表示,成為人工智能與自然語(yǔ)言處理領(lǐng)域的重要研究課題。英語(yǔ)詞匯由字母組合而成,與此不同,中文大部分詞匯的意義與其中漢字的意義密切相關(guān)。然而長(zhǎng)期以來(lái),大部分學(xué)者主要以英語(yǔ)為對(duì)象探索詞匯表示學(xué)習(xí)方法。這些方法難以利用中文詞匯內(nèi)部的漢字信息。

研究組本項(xiàng)目受到國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃(973計(jì)劃)和國(guó)家自然科學(xué)基金的支持,聚焦于面向深度學(xué)習(xí)的低維向量表示方案,提出一種既考慮詞匯外部上下文信息,同時(shí)考慮詞匯內(nèi)部漢字信息的中文詞匯表示學(xué)習(xí)模型——字符-詞匯聯(lián)合表示模型(Character Word Embedding,CWE,如圖所示)。在詞匯相似度計(jì)算和類(lèi)比推理兩個(gè)驗(yàn)證任務(wù)上的實(shí)驗(yàn)表明,與傳統(tǒng)詞匯表示學(xué)習(xí)模型相比,由于考慮了中文詞匯的漢字信息,CWE能夠顯著提升中文詞匯的表示能力。

Character Word Embedding(CWE)與傳統(tǒng)CBOW模型對(duì)比

IJCAI始于1969年,最初每2年舉行一次,從2014年開(kāi)始改為每年一次,是人工智能領(lǐng)域的頂級(jí)學(xué)術(shù)會(huì)議,被中國(guó)計(jì)算機(jī)學(xué)會(huì)推薦國(guó)際學(xué)術(shù)會(huì)議列表認(rèn)定為A類(lèi)會(huì)議。IJCAI 2015將于7月底在阿根廷布宜諾斯艾利斯召開(kāi),今年共收到1996篇投稿,錄用575篇,錄用率為28.8%。

供稿:計(jì)算機(jī)系 學(xué)生編輯:小潔

2015年04月25日 15:06:39

相關(guān)新聞

讀取內(nèi)容中,請(qǐng)等待...

最新動(dòng)態(tài)

清華大學(xué)新聞中心版權(quán)所有,清華大學(xué)新聞網(wǎng)編輯部維護(hù),電子信箱: [email protected]
Copyright 2001-2020 news.tsinghua.edu.cn. All rights reserved.