4月24日,應(yīng)工程系首席科學(xué)家Alex Kot院士邀請(qǐng),北京大學(xué)計(jì)算機(jī)學(xué)院施柏鑫教授蒞臨我校訪(fǎng)問(wèn)交流,并作題為《音頻同步與全景表征的視頻生成》的學(xué)術(shù)報(bào)告。本次報(bào)告會(huì)由陳昌盛教授主持。
施柏鑫教授深耕視覺(jué)感知與生成式智能領(lǐng)域,秉持問(wèn)題導(dǎo)向、實(shí)踐賦能的科研范式,立足產(chǎn)業(yè)實(shí)際痛點(diǎn)與技術(shù)發(fā)展前沿,深度融合計(jì)算成像、物理機(jī)理建模與新一代生成式 AI,構(gòu)建多學(xué)科交叉融合的創(chuàng)新研究體系。報(bào)告系統(tǒng)展示團(tuán)隊(duì)前沿研究成果,圍繞音視頻協(xié)同生成、全景視頻表征優(yōu)化等核心內(nèi)容展開(kāi)詳細(xì)闡述,通過(guò)結(jié)合物理光影、空間幾何與時(shí)序約束條件,基于通用基座模型開(kāi)展輕量化改造與增量式創(chuàng)新,采用分階段訓(xùn)練、小參數(shù)微調(diào)等策略提升模型訓(xùn)練效率與生成質(zhì)量。他指出,精準(zhǔn)可控生成是視頻 AIGC 的核心發(fā)展趨勢(shì),需兼顧音視頻時(shí)序?qū)R、物理邏輯合理性與空間連續(xù)性,同時(shí)依托事件相機(jī)、計(jì)算成像、視覺(jué)感知等底層基礎(chǔ)研究,實(shí)現(xiàn)感知技術(shù)與生成模型的雙向賦能。
報(bào)告非常精彩、內(nèi)容精深,兼具前沿視野與啟發(fā)意義?;?dòng)交流環(huán)節(jié)氛圍熱烈濃厚,與會(huì)師生緊扣研究難點(diǎn)、技術(shù)瓶頸、學(xué)科發(fā)展等問(wèn)題深入探討。施柏鑫教授逐一細(xì)致答疑解惑,并結(jié)合自身科研閱歷,就研究生科研素養(yǎng)培育、學(xué)術(shù)研究路徑規(guī)劃、博士學(xué)位論文凝練撰寫(xiě)等關(guān)鍵議題,分享獨(dú)到見(jiàn)解與寶貴經(jīng)驗(yàn),為青年學(xué)子成長(zhǎng)成才提供深刻指引。
報(bào)告結(jié)束后,工程系主任賈云得教授陪同施柏鑫教授參觀(guān)工程系人面機(jī)器人實(shí)驗(yàn)室、具身智能實(shí)驗(yàn)室、人工智能安全實(shí)驗(yàn)室,深入了解平臺(tái)建設(shè)、科研方向與人才培養(yǎng)現(xiàn)狀,為后續(xù)常態(tài)化學(xué)術(shù)往來(lái)、跨域科研協(xié)作與優(yōu)勢(shì)資源互補(bǔ)奠定基礎(chǔ)。

施柏鑫,北京大學(xué)長(zhǎng)聘副教授、博導(dǎo),計(jì)算機(jī)學(xué)院視頻與視覺(jué)技術(shù)研究所副所長(zhǎng);北京智源學(xué)者,北大-智平方具身智能聯(lián)合實(shí)驗(yàn)室主任。研究方向?yàn)橛?jì)算攝像學(xué)與計(jì)算機(jī)視覺(jué),發(fā)表論文270余篇(包括TPAMI論文37篇,計(jì)算機(jī)視覺(jué)三大頂級(jí)會(huì)議論文110余篇)。論文獲評(píng)CVPR 2024最佳論文亞軍、ICCP 2015最佳論文亞軍等,獲日本大川研究助成獎(jiǎng)(2021)、中國(guó)電子學(xué)會(huì)青年科學(xué)家獎(jiǎng)(2024)。擔(dān)任TPAMI、IJCV等國(guó)際頂刊編委,及CVPR、ICCV、ECCV等頂會(huì)領(lǐng)域主席??萍疾啃乱淮斯ぶ悄?chē)?guó)家科技重大專(zhuān)項(xiàng)首席科學(xué)家,國(guó)家級(jí)青年人才。