(通訊員韓璐陽)2020年11月27日下午16:00,信息科學與工程學院于新工科樓C326會議室開展“分支極限法及其機器學習”專題學術講座,講座由學院彭晨博士主講。周愷卿博士、全體研究生參加會議,周愷卿博士主持本次講座。

圖為會議現(xiàn)場
彭晨博士首先向我們指出了工業(yè)問題求解的典型需求,快速保證解的最優(yōu)性(可靠性)。此外,彭晨博士向我們詮釋了如何快速求解,這就要求盡量將實際問題建模為線性規(guī)劃,在建模時,將非線性成分線性化:對可導的非線性函數(shù)可在工作點附近線性化、對多個工作點,可設分段線性函數(shù),對分段函數(shù)可利用整數(shù)變量來線性化,此時問題變?yōu)椤盎煺麛?shù)線性規(guī)劃”(MILP)。緊接著,彭晨老師向我們詮釋了強化學習在多步決策應用中的問題,傳統(tǒng)的強化學習通常通過計算累積獎勵來學習最優(yōu)策略,然而在多步決策中,學習器不能頻繁地得到獎勵,且這種基于累積獎勵的學習方式存在非常巨大的搜索空間。通過這次分支極限法及其機器學習的學術講座,同學們對機器學習有了更加深刻的認識,受益匪淺。

圖為會議現(xiàn)場
主講人簡介:
彭晨,博士,講師, 2011年獲華南農業(yè)大學軟件工程專業(yè)學士學位,2014年獲中山大學計算機軟件與理論專業(yè)碩士學位,2019年獲美國內布拉斯加州大學林肯分校(University of Nebraska-Lincoln)電氣工程專業(yè)博士學位。攻讀碩士學位期間榮獲中山大學優(yōu)秀研究生獎學金與碩士研究生國家獎學金,攻讀博士學位期間榮獲美國J.T. and Margaret Talkington Fellowship獎學金。現(xiàn)主要從事電動汽車、交通智能化、控制理論和人工神經網絡方面的研究。在SCI/EI刊物上發(fā)表論文數(shù)篇。目前主持國家自然科學基金青年基金項目1項,湖南省教育廳優(yōu)秀青年項目1項。
【關閉】