深海中的魚,常常以左右兩側的同伴為觀察標志,相互之間保持適當?shù)木嚯x,形成“魚群效應”;草原上的羊群,也往往根據(jù)頭羊的行為調整自己的奔跑軌跡,形成“群體”。群組由個體間的信息傳遞構成,與單獨的個體相比,群組包含了更為豐富的信息,從宏觀層面反映了個體間的聯(lián)系,因此一直被社會學、心理學、自然科學領域的專家學者廣泛研究(如圖1所示)。群組效應不僅存在于自然界,也存在于我們的日常生活中。當人們進入超市、集會地點等擁擠場景時,會不自覺地產(chǎn)生從眾心理,形成多種多樣的群組。在人工智能、光學影像分析、機器視覺等領域,“群組檢測”是一個極具重要意義的研究課題:通過對監(jiān)控視頻中人群行為進行分析,將運動模式不同的群組檢測出來,有助于從語義層面理解行人的運動模式,及時發(fā)現(xiàn)場景中潛在的危險因素,對加強公共安全保障具有重要價值。 圖1 群組行為示例 然而,在實際人群場景中,群組的檢測非常困難。首先,由于人群的密集性,行人個體間存在嚴重的遮擋,極大程度上限制了個體提取的準確性;其次,傳統(tǒng)的群組檢測方法通常依賴于個體的運動方向等特征,但由于個體的不穩(wěn)定性,使得提取的特征往往過于局部化,難以反映個體的行為模式;此外,人群的多樣性也為群組的檢測帶來一定挑戰(zhàn),很難找到一組適用于各種場景的實驗參數(shù)。 圖2 基于特征融合的無參數(shù)群組檢測方法框架 針對上述難題,西北工業(yè)大學校人才特區(qū)——光學影像分析與學習中心(OPTIMAL)的科研團隊提出了一種基于特征融合的無參數(shù)群組檢測方法,該研究成果以“Detecting Coherent Groups in Crowd Scenes by Multiview Clustering”為題被人工智能領域重要期刊IEEE Transactions on Pattern Analysis and Machine Intelligence (T-PAMI)錄用。 這篇長文(regular paper)也是西北工業(yè)大學在IEEE T-PAMI上發(fā)表的、所有作者均唯一署名為西北工業(yè)大學的第一篇文章。參見:Qi Wang, Mulin Chen, Feiping Nie, and Xuelong Li, “Detecting Coherent Groups in Crowd Scenes by Multiview Clustering,”IEEE Transactions on Pattern Analysis and Machine Intelligence (T-PAMI), DOI: 10.1109/TPAMI.2018.2875002, 2018. 該工作把運動特征點作為研究對象,將群組檢測問題建模為圖優(yōu)化問題,使用多視角聚類方法對個體局部特征和結構上下文信息進行融合,實現(xiàn)無參數(shù)的群組檢測(如圖2所示)。實驗結果表明,多種特征的融合有效減少了個體特征局部化的問題,而無參數(shù)的特性使得該方法適用于復雜多樣的人群場景(如圖3所示)。 圖3 群組檢測實驗結果 IEEE T-PAMI是人工智能、機器學習、模式識別、數(shù)據(jù)挖掘、圖像處理、機器視覺等多個領域的重要國際期刊,其2017-2018年度影響因子為9.455,屬于中科院一區(qū)期刊,2018谷歌學術影響力排名的期刊(計算機視覺和模式識別領域)中位列第一,CCF人工智能領域A類推薦期刊中影響因子排名第一。隨著國內(nèi)人工智能等領域的飛速發(fā)展,近三年中,每年在IEEE T-PAMI上刊登的約185篇論文中已經(jīng)有約10篇左右是由大陸科研單位獨立發(fā)表,其中部分是長文。 來源:西工大新聞網(wǎng) |
Powered by Discuz!
© 2001-2017 Comsenz Inc.