極目新聞記者 柯稱
通訊員徐干城 鐘焯
稅前年薪不少于50萬元,提供最高350萬元安家費或人才房,授予博士生導師資格,為子女提供一條龍優質教育資源……日前,武漢大學官微推送了一期給力“廣告”,吸引全球英才依托武大申報海外優青。
海外優青是什么?為什么被武大吸引?又能給武大帶來什么?來看看武漢大學計算機學院“90后”博導葉茫的經歷。
葉茫
讓計算機“看清”世界
葉茫出生于1991年9月,2009年考入武大電子信息學院。大四時,他放棄了保研機會,考研進入計算機學院國家多媒體軟件工程技術研究中心,“選擇非常重要,只有真正喜歡的方向才能持續鉆研”。
專業基礎差是葉茫首先遭遇的難題。葉茫坦言,“剛進實驗室那會,經常問導師很多‘愚蠢’的基礎問題,曾經一度以為自己會被‘趕’出項目組”。“拖油瓶”的壓力持續了一段時間,葉茫碩士期間投稿的第一篇論文投了多次都沒有中。但導師鼓勵他,“要想變得出眾,就要比別人付出更多的汗水。”
在自身的熱愛堅持和團隊關心支持下,葉茫慢慢趕上。到2016年碩士畢業,葉茫已有4篇論文被多媒體頂級會議、期刊錄用,也是當時實驗室第一位以碩士身份發表CCF-A類論文的學生。計算機視覺領域的學術初探,讓他堅定了開展多媒體檢索相關研究的決心,“如果算法變好了,視頻檢索出來結果就更準確,可以非常直觀地感受到效果的變化”。
葉茫
2016年,葉茫前往香港浸會大學攻讀博士學位,繼續扎進智能安防應用中視頻圖像檢索領域。每天,他都是第一個到實驗室,最后一個離開。雖然辛苦,但目標明確,葉茫也享受這種靜下來慢慢做研究的感覺。
研究過程中,葉茫意識到,深度學習算法所依賴的大規模訓練數據標注耗時費力,提出了新穎的“實例增廣判別”的無監督特征學習思路,設計出一種快速的歸一化實例增廣特征優化學習方法,在大幅提升學習速度的同時,顯著提高在細粒度圖像檢索任務中新測試類別的檢索準確率。相關成果發表在人工智能頂級期刊TPAMI,計算機視覺頂級會議CVPR,得到了圖靈獎獲得者Geoffrey Hinton、Yann Lecun以及計算機視覺領域最有影響力學者何愷明等知名學者的引用和改進。
讓計算機像人眼一樣“看”世界,感知物體的大小、明暗、顏色、動靜,從圖像、視頻中挖掘出有意義的信息并且理解和思考——這是葉茫所從事的計算機視覺研究關注的核心問題。
監控目標檢索流程示例
“真實世界是多樣的,單純利用圖像或視頻很難解決復雜的任務,我更關注圖像、文本、視頻、語音的結合分析應用,以此增強對多媒體內容認知和推理的能力,提升人工智能模型在多媒體分析應用中的通用性和安全性。”葉茫舉例說,如果要從監控視頻中要找到一個犯罪嫌疑人,可以根據目擊者的文本描述,利用文本和圖像跨模態的匹配找到檢索目標;如果找到的目標有些像了,還可以增加“胖一點、高一點”等文本修飾,就能進一步提升目標檢索的準確性。
29歲回“珈”成為正教授
博士畢業后,葉茫又遠赴阿聯酋起源人工智能研究院擔任研究科學家,進一步將成果深化和轉化。
“在武大汲取養分的7年,為我筑牢了學術的根基。濃厚的人文氣息,任何一個地方都難以比擬,天人合一的美是武大獨有的。”2020年12月,葉茫參加武漢大學國際交叉學科論壇后,收到了母校的邀約,他決定帶著最新成果回到珞珈山。
當時只有29歲的葉茫,已是復雜受限場景下的多媒體檢索領域佼佼者,以第一/通訊作者發表CCF-A類論文20余篇,包括TPAMI、CVPR、ICCV等,6篇ESI高被引,7篇第一作者文章谷歌學術引用過百,總引用2600余次。
武漢大學唯才是舉,鑒于葉茫優秀的學術表現,提前按照海外優青標準給他相應待遇——直接聘任教授四級崗位、授予博導資格,連續4年保證1-2個博士生招收指標,并給他提供了充足的科研經費。在計算機學院、國家多媒體工程技術研究中心、湖北珞珈實驗室和人工智能研究院等平臺的疊加支持下,葉茫快速開展科研工作、建立科研團隊,并取得了多方面的學術收獲。
葉茫在CCF-A類人工智能頂級期刊TPAMI再次發表論文,主持國家自然科學基金面上項目、湖北省重點研發計劃等眾多項目,入選中國科協青年人才托舉工程。2021年年底,30歲的他又成功申報了青年海歸人才翹首以盼的科研資助——國家自然科學基金優秀青年基金(海外),進一步加速開展創新性研究。
將培養更多雷軍一樣的人才
入職后的9個月,葉茫正式迎來了自己第一批研究生。葉茫認為,“需要根據不同的特點做針對性的調整,因材施教還蠻有挑戰的,但是整體而言,他們都非常刻苦努力其實。我有個私心,想在武大培養像雷軍一樣能夠給學校捐樓的人。我現在肯定沒有這個能力了,只能靠他們了。”
葉茫和團隊成員在一起
為了培養更多“雷軍”,葉茫不僅注重培養學生的學術能力,鼓勵學生進行靈活的組會匯報,鉆研有深度有新意的課題,為學生提供更好的交流討論和學習的機會,還非常重視學生的創新能力培養,支持學生參加高質量的國際比賽。在2021年10月落幕的計算機視覺頂級會議ICCV 2021多模態視頻理解大賽中,葉茫帶領團隊學生陳朔怡、李賀和王同鑫在無人機特定目標檢索賽道奪得了冠軍。“現在做比賽跟我當年完全不一樣了,得益于學校充足的啟動經費,在硬件條件上有很大的提升,打比賽更加得心應手。”葉茫說。
同時,讓學生在產業一線錘煉本領也是葉茫內心的堅持,因為計算機領域的研究成果“絕不能養在深閨”。他帶領學生與海信集團合作開展了圖像文本相關性技術開發與研究,助力文本圖像跨模態理解在智能家居領域的應用;與華為公司合作提升視頻圖像檢索技術在城市安防中的應用;與綠盟科技合作開展了隱私保護的聯邦學習研究……
“今年30歲,我還可以在珞珈山奮斗30年。30年很長,除了在學術上繼續努力,我最想做的事就是帶好我的學生,特別是讓我的每個學生都能熱愛祖國、熱愛武大!”葉茫堅定地說。