清華新聞網(wǎng)8月16日電 清華大學(xué)交叉信息研究院孫麓巖研究組與鄧東靈研究組合作,在超導(dǎo)系統(tǒng)中演示了一種新型深度量子神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練過(guò)程。
近年來(lái),經(jīng)典機(jī)器學(xué)習(xí)已經(jīng)在科學(xué)研究和商業(yè)應(yīng)用中取得了顯著的成就。特別是深度神經(jīng)網(wǎng)絡(luò)模型的快速發(fā)展,對(duì)解決一些具有挑戰(zhàn)性的問(wèn)題起到了關(guān)鍵作用。深度神經(jīng)網(wǎng)絡(luò)的多層結(jié)構(gòu)被認(rèn)為是從復(fù)雜數(shù)據(jù)中提取有效特征的關(guān)鍵,而反向傳播訓(xùn)練算法則有效提升了深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練效率,推動(dòng)了其快速發(fā)展和廣泛應(yīng)用。與此同時(shí),量子機(jī)器學(xué)習(xí)領(lǐng)域也取得了重大進(jìn)展。在理論上,已有研究證明在某些特定的分類(lèi)任務(wù)中,量子機(jī)器學(xué)習(xí)模型相對(duì)于經(jīng)典機(jī)器學(xué)習(xí)模型具有指數(shù)級(jí)的加速優(yōu)勢(shì)。在實(shí)驗(yàn)方面,隨著量子器件的快速發(fā)展,一些量子機(jī)器學(xué)習(xí)模型,如量子卷積神經(jīng)網(wǎng)絡(luò),量子對(duì)抗機(jī)器學(xué)習(xí)模型,已在實(shí)驗(yàn)平臺(tái)上成功演示。
最近兩年,有理論工作提出一種新型的深度量子神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和量子反向傳播算法。然而,在當(dāng)前帶噪聲的中等規(guī)模量子器件上演示深度量子神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程面臨著很多困難。在本次工作中,孫麓巖研究組與鄧東靈研究組專(zhuān)注于該深度量子神經(jīng)網(wǎng)絡(luò)模型,并設(shè)計(jì)了一種可以在數(shù)字量子器件中實(shí)施的反向傳播算法,并在平面超導(dǎo)量子系統(tǒng)上成功演示了該模型的訓(xùn)練有效性和泛化能力。在該模型中,量子比特被分層排布,從而形成深度量子神經(jīng)網(wǎng)絡(luò)的多層結(jié)構(gòu);作用在相鄰層量子比特上的參數(shù)化量子線(xiàn)路構(gòu)成層間感知器。在正向運(yùn)行網(wǎng)絡(luò)的過(guò)程中,量子信息會(huì)通過(guò)量子感知器,由輸入層,經(jīng)過(guò)多個(gè)隱藏層,最終逐層傳遞到輸出層。在反向運(yùn)行網(wǎng)絡(luò)時(shí),量子信息會(huì)逐層由輸出層傳遞到輸入層。當(dāng)訓(xùn)練相鄰層間的量子門(mén)參數(shù)時(shí),我們需要分別正向和反向運(yùn)行深度量子神經(jīng)網(wǎng)絡(luò),并提取這相鄰兩層的局部量子信息,以計(jì)算層間各參數(shù)的梯度。

圖1.深度量子神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)及量子反向傳播算法示意圖

圖2.深度量子神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)兩比特量子通道的訓(xùn)練過(guò)程
實(shí)驗(yàn)演示了深度量子神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)量子通道的訓(xùn)練過(guò)程。實(shí)驗(yàn)通過(guò)反向傳播算法優(yōu)化網(wǎng)絡(luò)的門(mén)參數(shù),使得量子網(wǎng)絡(luò)輸出層的量子態(tài)與目標(biāo)量子通道的輸出態(tài)盡可能接近。在訓(xùn)練過(guò)程中,我們?cè)诹孔有酒险蜻\(yùn)行了深度量子網(wǎng)絡(luò),并在經(jīng)典計(jì)算機(jī)上模擬了網(wǎng)絡(luò)的反向運(yùn)行過(guò)程。實(shí)驗(yàn)通過(guò)量子態(tài)層析方法提取網(wǎng)絡(luò)中每一層的量子態(tài),并利用提取出的相鄰層間的量子態(tài)信息計(jì)算得到相鄰層間各參數(shù)的梯度,從而實(shí)現(xiàn)深度量子神經(jīng)網(wǎng)絡(luò)參數(shù)的迭代更新。
實(shí)驗(yàn)設(shè)計(jì)了深度為三層,每層寬度為兩比特的6比特超導(dǎo)量子芯片,用于學(xué)習(xí)兩比特量子通道。實(shí)驗(yàn)結(jié)果如圖2所示。結(jié)果表明,在較短的迭代次數(shù)內(nèi),訓(xùn)練過(guò)程可以有效收斂,且平均保真度最高達(dá)到96%。在泛化測(cè)試中,訓(xùn)練后的量子神經(jīng)網(wǎng)絡(luò)對(duì)于43%的隨機(jī)輸入態(tài),輸出態(tài)與目標(biāo)量子信道輸出態(tài)的保真度超過(guò)95%。這些實(shí)驗(yàn)結(jié)果成功展示了深度量子神經(jīng)網(wǎng)絡(luò)的可訓(xùn)練性與泛化能力。當(dāng)量子比特噪聲水平進(jìn)一步降低后,實(shí)驗(yàn)所用的訓(xùn)練方法可以直接擴(kuò)展到具有更深層數(shù)和更大寬度的大規(guī)模量子網(wǎng)絡(luò)上,從而進(jìn)一步提升量子機(jī)器學(xué)習(xí)的實(shí)用價(jià)值。
相關(guān)研究以“基于超導(dǎo)處理器的深度量子神經(jīng)網(wǎng)絡(luò)”(Deep quantum neural networks on a superconducting processor)為題,近日發(fā)表于《自然·通訊》(Nature Communications)上。
論文共同通訊作者為清華大學(xué)交叉信息研究院孫麓巖副教授和鄧東靈助理教授。清華大學(xué)交叉信息研究院2017級(jí)直博生潘嘯軒和2019級(jí)直博生魯智德為文章共同第一作者。其他作者還包括清華大學(xué)交叉信息研究院的王韋婷、華子越、徐奕放、李煒康、蔡偉州、李薛剛、王海艷、宋祎璞研究員,以及中國(guó)科學(xué)技術(shù)大學(xué)的鄒長(zhǎng)鈴教授。該研究得到國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃、國(guó)家自然科學(xué)基金、廣東省重點(diǎn)領(lǐng)域研發(fā)計(jì)劃、量子通信與量子計(jì)算機(jī)重大項(xiàng)目安徽省引導(dǎo)性項(xiàng)目、中國(guó)博士后基金、清華大學(xué)國(guó)強(qiáng)研究院和上海期智研究院等的支持。
論文鏈接:
https://www.nature.com/articles/s41467-023-39785-8
供稿:交叉信息研究院
題圖設(shè)計(jì):趙存存
編輯:李華山
審核:郭玲