交叉信息研究院學(xué)生11篇論文被國(guó)際表征學(xué)習(xí)大會(huì)(ICLR)接收
清華新聞網(wǎng)1月9日電 近日,深度學(xué)習(xí)領(lǐng)域頂級(jí)會(huì)議——國(guó)際表征學(xué)習(xí)大會(huì)(ICLR,International Conference on Learning Representations)公布了2020年論文錄用情況,清華大學(xué)交叉信息研究院共11篇論文被大會(huì)接收,其中5篇(4人次)來(lái)自交叉信息研究院研究生,6篇(5人次)來(lái)自計(jì)算機(jī)科學(xué)實(shí)驗(yàn)班(“姚班”)計(jì)科60。

圖片來(lái)源:論文《梯度下降可最大化齊次神經(jīng)網(wǎng)絡(luò)的分類(lèi)間隔》(呂凱風(fēng),李建)
交叉信息研究院2018級(jí)碩士生王同翰、2019級(jí)博士生王鑒浩、2015級(jí)博士生朱廣翔、2019級(jí)碩士生駱軒源和2019級(jí)博士生呂凱風(fēng)發(fā)表的5篇論文中,研究?jī)?nèi)容涵蓋多智能體強(qiáng)化學(xué)習(xí)中的探索-利用困境、可擴(kuò)展多智能體學(xué)習(xí)的值函數(shù)分解、深度強(qiáng)化學(xué)習(xí)的樣本效率、深度學(xué)習(xí)中梯度算法的泛化能力、以及深度學(xué)習(xí)中梯度算法的隱式偏好等問(wèn)題。其中,由交叉信息研究院李建副教授指導(dǎo)呂凱風(fēng)共同完成的論文《梯度下降可最大化齊次神經(jīng)網(wǎng)絡(luò)的分類(lèi)間隔》為演示論文(Talk Paper);由交叉信息研究院張崇潔助理教授指導(dǎo)王同翰和王鑒浩共同完成的論文《基于相互影響的多智能體協(xié)作探索》為大會(huì)亮點(diǎn)論文(Spotlight Paper)。
王遠(yuǎn)皓、董克凡、張?zhí)炜v、王蘊(yùn)韻和鄒岳松5名計(jì)科60同學(xué)發(fā)表的6篇論文中,研究?jī)?nèi)容涵蓋強(qiáng)化學(xué)習(xí)中免模型算法的高采樣效率、分布式老虎機(jī)任務(wù)中的悔恨值最小化的問(wèn)題、局部求解最小最大優(yōu)化問(wèn)題、神經(jīng)網(wǎng)絡(luò)的泛化性能、泛音卷積運(yùn)算和對(duì)超圖的特征學(xué)習(xí)問(wèn)題等。王遠(yuǎn)皓同學(xué)此次發(fā)表3篇第一作者論文。張?zhí)炜v合作完成的論文《兩層神經(jīng)網(wǎng)絡(luò)的漸進(jìn)泛化分析》入選大會(huì)亮點(diǎn)論文(Spotlight Paper)。
ICLR是公認(rèn)的深度學(xué)習(xí)領(lǐng)域國(guó)際頂級(jí)會(huì)議之一,關(guān)注有關(guān)深度學(xué)習(xí)各個(gè)方面的前沿研究,在人工智能、統(tǒng)計(jì)和數(shù)據(jù)科學(xué)領(lǐng)域以及機(jī)器視覺(jué)、語(yǔ)音識(shí)別、文本理解等重要應(yīng)用領(lǐng)域中發(fā)布了眾多極其有影響力的論文。ICLR采取完全公開(kāi)評(píng)審規(guī)則,任何對(duì)論文有興趣的研究者都可以參與到關(guān)于論文評(píng)審意見(jiàn)的討論中。這使得ICLR論文評(píng)審的透明性和廣泛性在深度學(xué)習(xí)頂級(jí)會(huì)議中獨(dú)樹(shù)一幟,同時(shí)也大大增加了論文被接收的難度。ICLR 2020共有2594篇論文提交,其中48篇被接收為演示論文(Talk Paper),107篇被接收為亮點(diǎn)論文(Spotlight Paper),532篇作為墻報(bào)論文(Poster Paper)。
供稿:交叉信息研究院
編輯:李晨暉
審核:周襄楠