西北工業(yè)大學(xué)在人工智能重要期刊IEEE T-PAMI上發(fā)表科研進(jìn)展
深海中的魚(yú),常常以左右兩側(cè)的同伴為觀察標(biāo)志,相互之間保持適當(dāng)?shù)木嚯x,形成“魚(yú)群效應(yīng)”;草原上的羊群,也往往根據(jù)頭羊的行為調(diào)整自己的奔跑軌跡,形成“群體”。群組由個(gè)體間的信息傳遞構(gòu)成,與單獨(dú)的個(gè)體相比,群組包含了更為豐富的信息,從宏觀層面反映了個(gè)體間的聯(lián)系,因此一直被社會(huì)學(xué)、心理學(xué)、自然科學(xué)領(lǐng)域的專(zhuān)家學(xué)者廣泛研究(如圖1所示)。群組效應(yīng)不僅存在于自然界,也存在于我們的日常生活中。當(dāng)人們進(jìn)入超市、集會(huì)地點(diǎn)等擁擠場(chǎng)景時(shí),會(huì)不自覺(jué)地產(chǎn)生從眾心理,形成多種多樣的群組。在人工智能、光學(xué)影像分析、機(jī)器視覺(jué)等領(lǐng)域,“群組檢測(cè)”是一個(gè)極具重要意義的研究課題:通過(guò)對(duì)監(jiān)控視頻中人群行為進(jìn)行分析,將運(yùn)動(dòng)模式不同的群組檢測(cè)出來(lái),有助于從語(yǔ)義層面理解行人的運(yùn)動(dòng)模式,及時(shí)發(fā)現(xiàn)場(chǎng)景中潛在的危險(xiǎn)因素,對(duì)加強(qiáng)公共安全保障具有重要價(jià)值。
圖1 群組行為示例
然而,在實(shí)際人群場(chǎng)景中,群組的檢測(cè)非常困難。首先,由于人群的密集性,行人個(gè)體間存在嚴(yán)重的遮擋,極大程度上限制了個(gè)體提取的準(zhǔn)確性;其次,傳統(tǒng)的群組檢測(cè)方法通常依賴(lài)于個(gè)體的運(yùn)動(dòng)方向等特征,但由于個(gè)體的不穩(wěn)定性,使得提取的特征往往過(guò)于局部化,難以反映個(gè)體的行為模式;此外,人群的多樣性也為群組的檢測(cè)帶來(lái)一定挑戰(zhàn),很難找到一組適用于各種場(chǎng)景的實(shí)驗(yàn)參數(shù)。
圖2 基于特征融合的無(wú)參數(shù)群組檢測(cè)方法框架
針對(duì)上述難題,西北工業(yè)大學(xué)校人才特區(qū)——光學(xué)影像分析與學(xué)習(xí)中心(OPTIMAL)的科研團(tuán)隊(duì)提出了一種基于特征融合的無(wú)參數(shù)群組檢測(cè)方法,該研究成果以“Detecting Coherent Groups in Crowd Scenes by Multiview Clustering”為題被人工智能領(lǐng)域重要期刊IEEE Transactions on Pattern Analysis and Machine Intelligence (T-PAMI)錄用。
這篇長(zhǎng)文(regular paper)也是西北工業(yè)大學(xué)在IEEE T-PAMI上發(fā)表的、所有作者均唯一署名為西北工業(yè)大學(xué)的第一篇文章。參見(jiàn):Qi Wang, Mulin Chen, Feiping Nie, and Xuelong Li, “Detecting Coherent Groups in Crowd Scenes by Multiview Clustering,”IEEE Transactions on Pattern Analysis and Machine Intelligence (T-PAMI), DOI: 10.1109/TPAMI.2018.2875002, 2018.
該工作把運(yùn)動(dòng)特征點(diǎn)作為研究對(duì)象,將群組檢測(cè)問(wèn)題建模為圖優(yōu)化問(wèn)題,使用多視角聚類(lèi)方法對(duì)個(gè)體局部特征和結(jié)構(gòu)上下文信息進(jìn)行融合,實(shí)現(xiàn)無(wú)參數(shù)的群組檢測(cè)(如圖2所示)。實(shí)驗(yàn)結(jié)果表明,多種特征的融合有效減少了個(gè)體特征局部化的問(wèn)題,而無(wú)參數(shù)的特性使得該方法適用于復(fù)雜多樣的人群場(chǎng)景(如圖3所示)。
圖3 群組檢測(cè)實(shí)驗(yàn)結(jié)果
IEEE T-PAMI是人工智能、機(jī)器學(xué)習(xí)、模式識(shí)別、數(shù)據(jù)挖掘、圖像處理、機(jī)器視覺(jué)等多個(gè)領(lǐng)域的重要國(guó)際期刊,其2017-2018年度影響因子為9.455,屬于中科院一區(qū)期刊,2018谷歌學(xué)術(shù)影響力排名的期刊(計(jì)算機(jī)視覺(jué)和模式識(shí)別領(lǐng)域)中位列第一,CCF人工智能領(lǐng)域A類(lèi)推薦期刊中影響因子排名第一。隨著國(guó)內(nèi)人工智能等領(lǐng)域的飛速發(fā)展,近三年中,每年在IEEE T-PAMI上刊登的約185篇論文中已經(jīng)有約10篇左右是由大陸科研單位獨(dú)立發(fā)表,其中部分是長(zhǎng)文。
來(lái)源:西工大新聞網(wǎng)