6月6日,主題為“多模態(tài)智能學習專題討論會”的第八屆珠峰論壇通過線上線下會議的方式在電子科技大學清水河校區(qū)順利召開。本次會議由中國圖象圖形學學會青年工作委員會,電子科技大學人力資源部教師發(fā)展中心,計算機學院教工第六支部委員會承辦。計算機學院教工第六黨支部——全國“雙帶頭人”教師黨支部書記工作室負責人楊陽教授、黨員教師姬艷麗副教授擔任本次會議的執(zhí)行主席。會議邀請到CSIG副理事長/中國科學技術大學俞能海教授、中科院計算所山世光研究員、西安電子科技大學鄧成教授、中國科學技術大學謝洪濤教授、南京理工大學魏秀參教授、西安電子科技大學王楠楠教授、西北工業(yè)大學王琦教授、北京工業(yè)大學毋立芳教授、哈爾濱工業(yè)大學左旺孟教授九位專家學者進行專題報告與研討。論壇吸引了來自多模態(tài)智能學習相關領域的學者及學生線下線上共計兩千余人參與,積極探索智能媒體信息處理的國際前沿研究與技術應用。
俞能海教授在開幕致辭中表示,舉辦中國圖象圖形學學會珠峰論壇,進行學術交流、探討國際前沿問題對推動科技自立自強、自主創(chuàng)新具有重要意義,對承辦單位的精心組織與安排給予了高度肯定,向八位教授無私奉獻出高質量學術報告表達了衷心感謝。俞教授代表學會對大會的召開表示祝賀,期待本次大會取得圓滿成功,寄語在國家自主創(chuàng)新、勇攀高峰的科技進程中發(fā)揮青年學者的作用。
中科院計算所山世光研究員作題為“遮擋魯棒的視覺模式識別方法”的報告。山世光研究員首先介紹了有部分遮擋的視覺模式識別的問題定義與解決該問題的基本思路,指出遮擋會帶來真實特征缺失、特征畸變等問題。針對遮擋帶來的問題,他分享了團隊最近在該問題上的部分研究工作,包括一種利用空域特征補全進行遮擋處理的方法、一種基于圖像層時空特征補全的方法和一種基于特征層時空特征補全的方法,并介紹了遮擋魯棒的表情識別和人臉識別的方法。在此基礎上,山世光研究員總結了遮擋條件下視覺模式識別問題一般化處理方法和技術。
西安電子科技大學鄧成教授進行了題為“多模態(tài)數(shù)據(jù)的認知與推理”的報告。他首先介紹了多模態(tài)智能領域的研究背景與研究挑戰(zhàn),指出多模態(tài)數(shù)據(jù)的認知與推理又是多模態(tài)智能的瓶頸問題,多模態(tài)智能面臨著表示準確性、推理合理性和模型魯棒性三個挑戰(zhàn),即數(shù)據(jù)表示難以控制、推理過程難以理解和決策結果不夠魯棒這三個關鍵問題。針對這三個關鍵問題,鄧教授分別從多模態(tài)數(shù)據(jù)表示、知識推理和魯棒學習三個方面分享了團隊近年來的最新研究進展。
中國科學技術大學的謝洪濤教授進行了題為“篡改文本圖像的生成與檢測 ”的報告。謝教授從篡改文本圖像生成和篡改文本圖像檢測兩個方面展開報告內容。對于篡改文本圖像生成,要解決字體多樣性、語言多樣性和背景多樣性等關鍵問題,團隊在之前的研究基礎上簡化了篡改文本生成網(wǎng)絡,并有針對性地僅對文字區(qū)域進行篡改。對于篡改文本圖像檢測,要發(fā)現(xiàn)篡改文本與真實文本的局部紋理差異,團隊提出了基于空域和頻域特征提取器的篡改文本檢測和基于空域和頻域關系建模的篡改文本檢測等方法。最后謝教授對如何進一步提升篡改文本生成與檢測的性能進行了總結與展望。
南京理工大學魏秀參教授進行了題為“開放動態(tài)環(huán)境下的圖像細粒度分析”的報告。魏教授首先介紹了細粒度圖像分析向多維領域快速發(fā)展的應用背景,指出圖像細粒度分析存在監(jiān)督信息不充足、樣本分布不平衡、類別空間不閉合等現(xiàn)實頻發(fā)問題。針對這些問題,魏教授介紹了團隊在開放動態(tài)環(huán)境下圖像細粒度分析方面的相關研究成果,分析討論如何解決對監(jiān)督信息的依賴、解決自然現(xiàn)象的長尾分布,以及如何在預處理中更廉價地進行物體定位、如何處理大規(guī)模哈希等問題,并簡要展望圖像細粒度分析的未來發(fā)展方向。
西安電子科技大學王楠楠教授進行了題為“對抗學習:魯棒深度學習模型的探索”的報告。王教授分別從深度學習的脆弱性、對抗攻擊方法和對抗防御方法三個方面圍繞深度學習的對抗魯棒性展開了討論。對于對抗攻擊問題,報告首先介紹了對抗噪聲的基本知識,然后介紹了不同類型的對抗攻擊方法,如數(shù)字對抗攻擊和物理對抗攻擊等。為了減小對抗噪聲對機器學習模型的惡意影響,報告還分享了多種形式的對抗防御策略,包括對抗訓練、預處理對抗防御和聯(lián)合對抗防御,以提升機器學習模型的魯棒性,促進構建可信的機器學習系統(tǒng)。
西北工業(yè)大學王琦教授進行了題為“面向真實場景的人群計數(shù)研究及其應用”的報告。王教授首先介紹了人群計數(shù)研究領域的背景意義和研究現(xiàn)狀,現(xiàn)有方法主要有基于檢測、基于全局回歸和基于密度圖三種計數(shù)方式,但是存在數(shù)據(jù)集小、算法泛化能力弱和人群計數(shù)基準評測平臺缺失等問題。針對這些問題,王教授重點介紹了團隊三個方面的工作:基于虛擬數(shù)據(jù)的人群計數(shù)、基于圖像內容遷移的域適配人群計數(shù)和大尺度人群計數(shù)數(shù)據(jù)庫及測試平臺,并在最后進行了簡要的總結與展望。
北京工業(yè)大學毋立芳教授進行了題為“圖像情感分析研究與展望”的報告。毋教授首先對圖像情感分析研究背景進行了總結,歸納了情感分析任務主要有情感分類、表情識別、情感分布學習和情感檢索匹配等,然后介紹了現(xiàn)有的情感模型和情感數(shù)據(jù)庫。報告還重點總結了現(xiàn)有的基于視覺特征的圖像情感分析方法、結合文本語義信息的圖像情感分析方法,并對圖像情感分析任務進行了總結與展望。最后,毋教授還介紹了團隊在體育視頻分析及應用中的工作與成果。
哈爾濱工業(yè)大學左旺孟教授進行了題為“復雜場景圖像生成與小樣本領域自適應”的報告。左教授主要介紹了團隊近期在圖像生成方面的一些工作。針對當前生成模型在生成復雜場景方面的問題與不足,從條件圖像生成角度出發(fā),左教授介紹了基于語義分割圖的場景圖像生成和基于自然語言描述的圖像修復。針對場景圖像生成,從充分利用分割輪廓的角度出發(fā),左教授介紹了形狀上下文增強和形狀檢索增強的空域自適應規(guī)格化兩種方法。針對基于自然語言描述的圖像修復,左教授介紹了當前主流的VQGAN方法的缺失區(qū)域擴充和修復結果不一致問題的可能解決方案。最后,從適應的忠實性和生成結果的多樣性角度出發(fā),報告還介紹了團隊在小樣本生成式領域自適應的研究工作。
精彩的學術報告向與會者介紹了智能媒體信息處理方向的最新前沿進展,充分激發(fā)了大家的興趣和熱情。
中國圖象圖形學學會珠峰論壇是由中國圖象圖形學學會青年工作委員會發(fā)起的學術論壇。論壇面向國際學術前沿與國家戰(zhàn)略需求,致力于深度挖掘圖象圖形領域的前沿問題,為青年學者們提供學術交流與研討的平臺,促進學者之間的交流與合作。自2018年11月珠峰論壇發(fā)起至今已舉辦七期,每期圍繞圖象圖形學領域的一個研究方向進行專題研討與深入交流。往期論壇圍繞圖形學中的人工智能、計算成像前沿、多媒體智能處理與通信、智能圖形與3D視覺、學習與智能感知、沉浸式視頻處理等專題開展,相關領域的專家、青年學者以及企業(yè)界人員進行了產(chǎn)學研研討與交流。
電子科技大學計算機學院教工第六支部現(xiàn)有黨員21人,其中國家級人才4人,由楊陽教授擔任支部書記,2018年入選首批全國高?!半p帶頭人”教師黨支部書記工作室。支部成員積極發(fā)揮專業(yè)優(yōu)勢,瞄準人工智能前沿領域和國家重大戰(zhàn)略需求,進行戰(zhàn)略性、儲備性技術項目研發(fā)、技術創(chuàng)新和重點攻關,主持多項國家級重大重點項目,推動相關研究成果在國防科技等關鍵領域實際應用,積極服務國家人民。
此外本次論壇得到了電子科技大學人力資源部教師發(fā)展中心的大力支持。(來源:電子科技大學)
中國汽車工業(yè)協(xié)會吁車企避免以低于成本價傾銷商品
比亞迪近期大幅下調多款智能駕駛車型售價,引發(fā)市場對新一輪價格...(806 )人閱讀時間:2025-05-31第一期“人工智能與機器人產(chǎn)業(yè)創(chuàng)新發(fā)展專題研討會”成功召開,共
近日,第一期“人工智能與機器人產(chǎn)業(yè)創(chuàng)新發(fā)展專題研討會”在東方...(693 )人閱讀時間:2025-05-30DeepSeek發(fā)布新版R1 能力接近美國頂尖模型
人工智能起步公司深度求索(DeepSeek)發(fā)布其熱門推理模...(1002 )人閱讀時間:2025-05-30特斯拉股東集體喊話馬斯克
據(jù)報道,5月28日,一群長期投資特斯拉的養(yǎng)老基金股東聯(lián)名致信...(602 )人閱讀時間:2025-05-30