清華新聞網(wǎng)6月18日電 近日,清華大學(xué)交叉信息院黃隆波教授團(tuán)隊(duì)科研成果“老虎機(jī)式反饋下的對(duì)抗網(wǎng)絡(luò)優(yōu)化:在非穩(wěn)定的多跳網(wǎng)絡(luò)中最大化效用”(Adversarial Network Optimization under Bandit Feedback: Maximizing Utility in Non-Stationary Multi-Hop Networks)在美國(guó)計(jì)算機(jī)協(xié)會(huì)(ACM)計(jì)算機(jī)系統(tǒng)測(cè)量和建模學(xué)會(huì)會(huì)議(ACM SIGMETRICS 2025(International Conference on Measurement and Modeling of Computer Systems)上獲得最佳論文獎(jiǎng)。

獲獎(jiǎng)證書(shū)
黃隆波團(tuán)隊(duì)聚焦網(wǎng)絡(luò)優(yōu)化領(lǐng)域的經(jīng)典問(wèn)題“隨機(jī)網(wǎng)絡(luò)優(yōu)化(SNO)”進(jìn)行探索。該問(wèn)題考慮在動(dòng)態(tài)變化的網(wǎng)絡(luò)系統(tǒng)中,如何合理分配網(wǎng)絡(luò)資源以最優(yōu)化吞吐量和系統(tǒng)效用,在網(wǎng)絡(luò)通信、計(jì)算調(diào)度與運(yùn)籌管理等領(lǐng)域均有重要應(yīng)用。傳統(tǒng)的SNO算法通常要求網(wǎng)絡(luò)條件(例如信道質(zhì)量、傳輸帶寬、任務(wù)到達(dá)速率等)具備穩(wěn)定的分布,且這些條件在每次做出分配前就對(duì)決策者已知,因而在許多重要的動(dòng)態(tài)、未知場(chǎng)景中難以直接應(yīng)用。
針對(duì)這些局限性,黃隆波團(tuán)隊(duì)提出新的理論模型“對(duì)抗網(wǎng)絡(luò)優(yōu)化(ANO)”并設(shè)計(jì)了新的優(yōu)化算法。該算法在網(wǎng)絡(luò)條件動(dòng)態(tài)、對(duì)抗且信息反饋極度受限的情況下,在任意復(fù)雜的多跳網(wǎng)絡(luò)中,都能保證網(wǎng)絡(luò)系統(tǒng)的長(zhǎng)期穩(wěn)定和效用最大化。算法首先通過(guò)全局的Lyapunov分析,將ANO性能分析與對(duì)抗式在線(xiàn)學(xué)習(xí)建模進(jìn)行結(jié)合。針對(duì)網(wǎng)絡(luò)優(yōu)化問(wèn)題的固有挑戰(zhàn),例如無(wú)上界且變化劇烈的任務(wù)隊(duì)列,論文給出了新的、面向隊(duì)列的在線(xiàn)學(xué)習(xí)算法以實(shí)現(xiàn)自適應(yīng)。最后,通過(guò)自控制的思路,將網(wǎng)絡(luò)系統(tǒng)中的任務(wù)總數(shù)用其自身的多項(xiàng)式控制,進(jìn)而提供了網(wǎng)絡(luò)系統(tǒng)的吞吐量保證,并證明系統(tǒng)效用以多項(xiàng)式速度收斂至最優(yōu)值。
論文第一作者為姚班2024屆本科畢業(yè)生戴言,通訊作者為交叉信息院教授黃隆波。
供稿:交叉信息院
編輯:肖零
審核:郭玲