在AI時(shí)代,越來(lái)越多的生物特征可以被提取出來(lái)并進(jìn)行識(shí)別,目前市場(chǎng)應(yīng)用比較多的有人臉識(shí)別、指紋識(shí)別、聲紋識(shí)別等,而門檻相對(duì)較高的虹膜識(shí)別、掌靜脈識(shí)別、步態(tài)識(shí)別技術(shù)等技術(shù)則在落地應(yīng)用中難覓蹤影。
在疫情發(fā)生后,應(yīng)用范圍廣泛的人臉識(shí)別、指紋識(shí)別等技術(shù)卻出現(xiàn)了很大的應(yīng)用受阻。
比如人臉識(shí)別技術(shù),只提取人的臉部特征信息,在戴口罩、或者燈光黑暗、拍攝角度不佳、帽子遮擋等情況下,人臉識(shí)別技術(shù)難以發(fā)揮效用。
為此,彌補(bǔ)人臉識(shí)別技術(shù)不足的一些技術(shù)也應(yīng)運(yùn)而生,比如步態(tài)識(shí)別技術(shù)、行人重識(shí)別ReID技術(shù),這兩個(gè)技術(shù)都能在一定程度上彌補(bǔ)人臉識(shí)別的不足。
步態(tài)識(shí)別技術(shù)和行人重識(shí)別ReID技術(shù)其實(shí)是兩個(gè)并不相同的技術(shù),但不了解他們的人,很容易將兩者混為一談,接下來(lái)我們就從幾個(gè)方面來(lái)剖析了解兩者究竟有何不同,以及他們?cè)诼涞貞?yīng)用的場(chǎng)景中又有哪些優(yōu)勢(shì)?
兩者的概念不同
▎什么是步態(tài)識(shí)別?
它是通過(guò)身體體型和行走姿態(tài)來(lái)分析人的身份,其物理基礎(chǔ)是每個(gè)人不同的生理結(jié)構(gòu):身高、頭型、腿骨、臂展、肌肉、重心、神經(jīng)靈敏度等。
在日常生活中,如果在遠(yuǎn)處出現(xiàn)一個(gè)你熟悉的身影,即使看不清面部,或者穿了一件你從來(lái)沒(méi)有見(jiàn)過(guò)的衣服,但是憑借你對(duì)他的熟悉程度,你依然可以認(rèn)出他的身影。這其實(shí)是人類視覺(jué)的一個(gè)步態(tài)識(shí)別。
步態(tài)識(shí)別是一種生物特征識(shí)別技術(shù),是對(duì)于人的全身特征的一個(gè)識(shí)別,具有遠(yuǎn)距離、跨視角、非受控的優(yōu)勢(shì)。
最初,大家了解這個(gè)技術(shù)源自一部電影《碟中諜5》,在當(dāng)時(shí)看來(lái),很有科幻色彩。隨后,科研機(jī)構(gòu)也對(duì)此展開(kāi)了研究,但多年來(lái),這個(gè)技術(shù)還停留在實(shí)驗(yàn)階段,技術(shù)概念多于落地應(yīng)用。
唯有大華股份和銀河水滴公開(kāi)表示在步態(tài)識(shí)別技術(shù)領(lǐng)域取得新的突破,其中,大華在2019年深圳安博會(huì)上發(fā)布的7大“黑科技”中,就有一個(gè)與步態(tài)識(shí)別相關(guān)的技術(shù)——跨相機(jī)跟蹤技術(shù):使用目標(biāo)檢測(cè)與步態(tài)識(shí)別技術(shù),實(shí)現(xiàn)多個(gè)攝像機(jī)之間目標(biāo)物體的視頻接力跟蹤。
但對(duì)于這項(xiàng)技術(shù)的場(chǎng)景落地應(yīng)用,大華并沒(méi)有過(guò)多著墨,以致目前在市場(chǎng)上,銀河水滴成為唯一一家以步態(tài)識(shí)別技術(shù)為核心技術(shù)的人工智能企業(yè),并且已經(jīng)落地應(yīng)用。
▎什么是行人重識(shí)別?
行人重識(shí)別(Person Re-identification)也稱行人再識(shí)別,簡(jiǎn)稱為ReID,是利用計(jì)算機(jī)視覺(jué)技術(shù)判斷圖像或者視頻序列中是否存在特定行人的技術(shù)。
在多攝像設(shè)備網(wǎng)絡(luò)下對(duì)行人進(jìn)行檢索,利用步態(tài)動(dòng)作、身體特征等更為全面的信息來(lái)識(shí)別人物,無(wú)論單獨(dú)使用還是與人臉識(shí)別相結(jié)合,都能發(fā)揮更大的應(yīng)用價(jià)值。
特別是當(dāng)攝像頭無(wú)法抓拍到清晰的人臉時(shí),行人重識(shí)別技術(shù)就發(fā)揮著非常重要的作用,只需看行人的穿著、體態(tài)、發(fā)型就“認(rèn)出”人。
ReID也有另外一個(gè)名稱,叫“跨鏡追蹤”,可以對(duì)無(wú)法獲取清晰拍攝人臉的行人進(jìn)行跨攝像頭連續(xù)跟蹤,從不同攝像機(jī)拍攝的圖像或視頻中找出同一個(gè)人物,增強(qiáng)數(shù)據(jù)的時(shí)空連續(xù)性。
目前,大華、宇視、曠視、商湯、依圖、云從、阿里、云天勵(lì)飛等涉及AI業(yè)務(wù)的企業(yè)幾乎都有這項(xiàng)技術(shù),有很強(qiáng)的市場(chǎng)成熟度。
兩者提取的特征點(diǎn)不同
步態(tài)識(shí)別提取的特征點(diǎn)包含兩個(gè)方面,一方面是提取靜態(tài)的內(nèi)部特征,如身高、頭型、腿骨、關(guān)節(jié)、肌肉等生理結(jié)構(gòu),這些特征相對(duì)比較穩(wěn)定,在很長(zhǎng)一段時(shí)間,都不會(huì)發(fā)生大的變化;
第二方面,是提取人的動(dòng)態(tài)特征,比如走路姿態(tài)、手臂擺幅、晃頭聳肩、運(yùn)動(dòng)神經(jīng)敏感度等,這些動(dòng)態(tài)特征與身體屬性密不可分,很長(zhǎng)一段時(shí)間內(nèi)也會(huì)相對(duì)比較穩(wěn)定。但是,這些動(dòng)態(tài)特征的提取與處理難度也更大。
行人重識(shí)別依靠行人的整體姿態(tài)來(lái)做檢索,主要提取靜態(tài)的外部特征,比如穿著、背包、發(fā)型、雨傘等,通過(guò)分析行人的穿著和體態(tài)來(lái)識(shí)別人。
但是,這些靜態(tài)的外部特征很容易發(fā)生改變,比如整體外型發(fā)生變化,換了衣服、發(fā)型、帽子、鞋子,甚至是偽裝姿態(tài)、體型等等,那么,行人重識(shí)別在此時(shí)能發(fā)揮的作用就比較有限。
算法模型訓(xùn)練不同
銀河水滴技術(shù)總監(jiān)張曼博士在CPS中安網(wǎng)的《安防微課》中,對(duì)步態(tài)識(shí)別技術(shù)的技術(shù)原理和算法訓(xùn)練進(jìn)行了詳細(xì)介紹。
步態(tài)識(shí)別技術(shù),首先是用攝像頭對(duì)人走路的過(guò)程進(jìn)行數(shù)據(jù)獲取,然后進(jìn)行數(shù)據(jù)的檢測(cè)和分割,也就是說(shuō)將人形區(qū)域和背景區(qū)域剝離開(kāi)來(lái)。
然后把行人在整個(gè)行走過(guò)程中的每一幀畫面進(jìn)行步態(tài)分割,形成整個(gè)走路周期,然后再對(duì)步態(tài)的特征進(jìn)行提取和表達(dá),最后跟步態(tài)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行比對(duì)和識(shí)別。
行人動(dòng)態(tài)信息較多,每一個(gè)環(huán)節(jié)其實(shí)都是一個(gè)非常難的問(wèn)題。比如在數(shù)據(jù)獲取階段,怎么獲取數(shù)據(jù),怎么構(gòu)建步態(tài)識(shí)別的數(shù)據(jù)庫(kù);在獲取到數(shù)據(jù)后怎么分割前景和背景,怎么讓它更精確;在特征表達(dá)的階段,怎么解決跨視角的識(shí)別問(wèn)題等等。
銀河水滴研發(fā)一套大規(guī)模的步態(tài)識(shí)別系統(tǒng),涵蓋軟件“步態(tài)識(shí)別互聯(lián)系統(tǒng)4.0”和硬件“小規(guī)模檢索步態(tài)識(shí)別一體機(jī)”、“大規(guī)模檢索-步態(tài)抓拍盒子&陣列”,將海量的視頻數(shù)據(jù)接入到步態(tài)識(shí)別系統(tǒng)中,利用抓拍盒子、抓拍陣列等硬件的處理,將原始的視頻進(jìn)行固態(tài)的結(jié)構(gòu)化處理。
現(xiàn)在的一些核心算法,包括超精度的目標(biāo)分割,能達(dá)到的精度已經(jīng)跟人眼差不多;還有極速的目標(biāo)檢測(cè),以及跨視角的識(shí)別精度都已經(jīng)處在世界首位。
除此之外,步態(tài)識(shí)別技術(shù)還需要龐大的貼近實(shí)際場(chǎng)景的步態(tài)數(shù)據(jù)庫(kù),銀河水滴參與和創(chuàng)建公開(kāi)、自有的步態(tài)數(shù)據(jù)庫(kù),目前還與公安系統(tǒng)和司法系統(tǒng)共同推進(jìn)造庫(kù)計(jì)劃,大規(guī)模地將嫌疑人的步態(tài)數(shù)據(jù)采集入庫(kù)。
行人重識(shí)別ReID方面,依圖科技最近在該領(lǐng)域有了新突破,為此,在這里以依圖科技的算法水平作為參考進(jìn)行闡述。
在行人重識(shí)別技術(shù)領(lǐng)域,首位命中率(Rank-1 Accuracy)和平均精度均值(Mean Average Precision,mAP)是業(yè)內(nèi)公認(rèn)的衡量算法水平的核心指標(biāo)。
在三大ReID公認(rèn)數(shù)據(jù)集Market1501、DukeMTMC-ReID、CUHK03上,依圖將衡量算法性能的兩大關(guān)鍵指標(biāo)“首位命中率”(Rank-1 Accuracy)及“平均精度均值”(Mean Average Precision,mAP)的六項(xiàng)數(shù)據(jù)全部提升,刷新世界記錄。
首位命中率高,意味著算法能夠在眾多圖像中準(zhǔn)確找出容易識(shí)別或者匹配的那張,并不能反應(yīng)模型的真實(shí)能力,尤其是應(yīng)對(duì)復(fù)雜場(chǎng)景的表現(xiàn);
而平均精度均值mAP值越高,說(shuō)明系統(tǒng)的實(shí)用性越好,既能查得全也能查得準(zhǔn),能夠較好地應(yīng)對(duì)多遮擋、光線暗、畫面模糊等情況。
因此,評(píng)價(jià)行人重識(shí)別算法性能時(shí)需要結(jié)合mAP值,它反映的是系統(tǒng)的綜合檢索性能。
依圖科技深度優(yōu)化了ReID算法框架,提升了算法效率,通過(guò)結(jié)合AutoML等前沿技術(shù),進(jìn)一步實(shí)現(xiàn)了模型參數(shù)的自動(dòng)搜索與迭代,突破了依賴算法研究員手工設(shè)計(jì)與調(diào)優(yōu)的傳統(tǒng)算法開(kāi)發(fā)流程,在降低人力成本的同時(shí),使得算法的泛化性能更強(qiáng)。
兩者面對(duì)的挑戰(zhàn)不同
步態(tài)識(shí)別具有非接觸、遠(yuǎn)距離和不容易偽裝的優(yōu)勢(shì);但在落地應(yīng)用時(shí),步態(tài)識(shí)別需要隨機(jī)采樣大量的時(shí)序步態(tài)數(shù)據(jù)進(jìn)行模型學(xué)習(xí),建步態(tài)庫(kù),然后根據(jù)步態(tài)數(shù)據(jù)提供系統(tǒng)解決方案。
在前期建庫(kù)采集數(shù)據(jù)的時(shí)候,步態(tài)識(shí)別的正面識(shí)別率低,容易受到性別、步長(zhǎng)、節(jié)奏、速度等的干擾;同時(shí),相機(jī)角度、天氣條件、遮擋物、附屬物、道路崎嶇、甚至衣服光照等都會(huì)影響準(zhǔn)確性;比較難獲取年齡、性別等信息,而且非普遍性,如殘疾人不適合步態(tài)識(shí)別技術(shù)。
那么在落地商用的過(guò)程中,大多數(shù)監(jiān)控場(chǎng)景都是比較復(fù)雜的,可能存在多個(gè)運(yùn)動(dòng)物體,行人圖像容易受天氣、光照等外界因素的影響,而有所變化。
以日照條件下運(yùn)動(dòng)目標(biāo)的影子為例,它可能與被檢測(cè)的目標(biāo)相連,也可能與目標(biāo)分離。如果是前者,影子扭曲了目標(biāo)形狀,使基于輪廓的步態(tài)識(shí)別方法不可靠;如果后者,影子可能被誤認(rèn)為是場(chǎng)景中一個(gè)錯(cuò)誤的目標(biāo)。
因此,在實(shí)際場(chǎng)景下的步態(tài)檢測(cè)面對(duì)的挑戰(zhàn)不小。
銀河水滴為了應(yīng)對(duì)這些挑戰(zhàn),推出了一系列產(chǎn)品和解決方案:步態(tài)檢索智能一體機(jī)“水滴神鑒”,步態(tài)識(shí)別、檢索與追蹤系統(tǒng)“水滴慧眼”,步態(tài)抓拍盒子,步態(tài)人臉抓拍機(jī),WATRIXBOX等。
通過(guò)采取三種不同的模式來(lái)建立實(shí)戰(zhàn)的步態(tài)數(shù)據(jù)庫(kù):
步態(tài)人臉自動(dòng)建庫(kù)(武漢模式):采集對(duì)象:有人臉信息的在逃人員/重點(diǎn)人員
步態(tài)采集系統(tǒng)(上海模式):采集對(duì)象:未來(lái)需關(guān)注的重點(diǎn)人員
未破獲案件視頻庫(kù)(重慶模式):采集對(duì)象:無(wú)人臉信息的在逃人員/重點(diǎn)人員
同時(shí),在解決方案中還融合多種技術(shù),包括ReID、足跡辨別、人臉識(shí)別、電子圍欄、視頻結(jié)構(gòu)化等。
這些產(chǎn)品和解決方案,讓銀河水滴的步態(tài)識(shí)別技術(shù)在派出所、看守所、監(jiān)獄、公安刑事案件等領(lǐng)域中得到應(yīng)用,為人臉識(shí)別提供較大的補(bǔ)充。
行人重識(shí)別是需要利用大量單個(gè)人體同一時(shí)段不同監(jiān)控下的圖像信息進(jìn)行模型學(xué)習(xí)。在用于監(jiān)控場(chǎng)景中相對(duì)較短時(shí)間內(nèi)的行人識(shí)別,精度較高,算法速度可達(dá)到毫秒級(jí)別。
在真實(shí)場(chǎng)景下,ReID算法需要做到在跨時(shí)間段、跨場(chǎng)景、跨不同成像質(zhì)量的圖像采集設(shè)備下進(jìn)行高精度的快速識(shí)別,而這些攝像機(jī)所覆蓋的范圍彼此并不重疊,導(dǎo)致缺乏連貫的信息。
而且在不同畫面中,人物的姿態(tài)、行為及外觀會(huì)發(fā)生較大變化,不同時(shí)間、場(chǎng)景的光照、背景和遮擋物各不相同,背景中還常有體型、衣著相似的其他人物干擾;攝像機(jī)的分辨率也有高有低,人物在畫面中出現(xiàn)的位置有遠(yuǎn)有進(jìn),這些都對(duì)ReID技術(shù)提出了挑戰(zhàn)。
行人的姿態(tài)多變導(dǎo)致人臉上廣泛使用的對(duì)齊技術(shù)也在ReID中失效。行人的數(shù)據(jù)獲取難度遠(yuǎn)遠(yuǎn)大于人臉識(shí)別數(shù)據(jù)獲取難度,而行人的信息復(fù)雜程度又遠(yuǎn)遠(yuǎn)大于人臉,這兩個(gè)因素疊加在一起,使得ReID的算法研究變得更加困難,也更加重要。
通過(guò)算法的有效設(shè)計(jì),降低對(duì)數(shù)據(jù)依賴來(lái)實(shí)現(xiàn)ReID效果的突破是現(xiàn)在業(yè)內(nèi)的共識(shí)。這不僅對(duì)算法提出更高要求,也需要更高效的芯片提供強(qiáng)大的算力支持,二者缺少任意一個(gè),都會(huì)影響行人重識(shí)別的實(shí)際應(yīng)用價(jià)值。
依圖在2017年投入云端AI芯片QuestCore?(求索)的研發(fā),并于2019年5月“發(fā)布即商用”。QuestCore?是全球首顆云端視覺(jué)AI芯片,提供強(qiáng)大算力,單路攝像頭功耗不到1W。
在行人重識(shí)別實(shí)戰(zhàn)應(yīng)用中,依圖研發(fā)人員對(duì)算法做了進(jìn)一步優(yōu)化, 依托依圖自研AI芯片, 在僅憑穿著、體態(tài)特征的條件下,已能將行人重識(shí)別技術(shù)做到2017年~2018年人臉識(shí)別的精度。
在智慧城市領(lǐng)域,ReID技術(shù)能通過(guò)軌跡還原功能,快速篩查可疑人員并進(jìn)一步鎖定出行區(qū)域,進(jìn)而做到精準(zhǔn)預(yù)防和打擊。
應(yīng)用到智能園區(qū)和智能交通領(lǐng)域,ReID可對(duì)于陌生人等可疑人員進(jìn)行全方位刻畫,有效保障園區(qū)安全;
在人流密集的超市、園區(qū)等大型公共場(chǎng)所,ReID能夠幫助實(shí)現(xiàn)不慎走失的兒童、老人的迅速查找;
在地鐵站、機(jī)場(chǎng)等交通樞紐區(qū)域,ReID技術(shù)可以配合人臉、局部的動(dòng)作和姿態(tài)進(jìn)行快速識(shí)別,大幅提升人員過(guò)檢速度。
在智能交通領(lǐng)域,ReID有助于在道路、車輛和駕駛員之間建立快速的智能通信聯(lián)系,形成人、車、道路的完整調(diào)動(dòng)閉環(huán),精準(zhǔn)感知交通路口各個(gè)方向的車輛數(shù)量、流量和密度,為交警決策提供準(zhǔn)確依據(jù);
在無(wú)人駕駛領(lǐng)域,ReID可有效對(duì)車輛、行人、障礙物、道路以及交通信號(hào)燈和交通標(biāo)識(shí)進(jìn)行感知,構(gòu)建真正智能的交通體系,帶給人們更加安全、便捷的出行體驗(yàn)。
結(jié)語(yǔ):
在數(shù)據(jù)時(shí)代,AI技術(shù)賦能視頻監(jiān)控后,視頻圖像可以全面看、自動(dòng)看、關(guān)聯(lián)看,可以跨系統(tǒng)、跨區(qū)域,而且算得快、識(shí)得準(zhǔn)。
無(wú)論是人臉識(shí)別、虹膜識(shí)別、指紋識(shí)別和步態(tài)識(shí)別等生物識(shí)別技術(shù),還是圖像檢索的行人重識(shí)別技術(shù),通過(guò)計(jì)算機(jī)視覺(jué)或機(jī)器學(xué)習(xí)的方式,發(fā)展到如今,都各有所長(zhǎng),彼此互補(bǔ)。
步態(tài)識(shí)別、行人重識(shí)別雖然有很多的不同,但它們?cè)谌四樧R(shí)別不能發(fā)揮效用的時(shí)候,都能起到重要的補(bǔ)充識(shí)別作用。
而且,這些識(shí)別技術(shù)在實(shí)際落地應(yīng)用的時(shí)候,若要發(fā)揮更大的效能,是需要彼此融合、彼此學(xué)習(xí),不能完全割裂或獨(dú)立。
相信在不久的將來(lái),多種識(shí)別技術(shù)彼此結(jié)合,能滿足市場(chǎng)更多更豐富的場(chǎng)景應(yīng)用需求。
關(guān)聯(lián)標(biāo)簽:
文章來(lái)源:河姆渡智能建筑
文章網(wǎng)址: