人才濟濟的CV賽道,從來不缺黑馬,千視通便是其中一匹。
近日,主打原創(chuàng)人工智能算法與視頻深度學習技術的千視通,在Market 1501、DukeMTMC-reID、CUHK03這三個衡量Re-ID技術最通用的數(shù)據(jù)集測試中,獲得了巨大突破。 這些數(shù)據(jù)集中有兩項核心指標評判標準:首位命中率(Rank-1 Accuracy)以及平均精度均值(Mean Average Precision,縮寫mAP,它反映檢索的人在底庫中的所有圖片排在結果隊列前面的程度)。
根據(jù)相關數(shù)據(jù)顯示,目前千視通在Market 1501上的首位命中率(Rank-1 Accuracy)已經(jīng)達到97.1%,超越人眼識別能力(94%),并刷新了今年4月公布的96.6%的行業(yè)紀錄。
同時在CUHK03,Duke MTMC-reID兩個數(shù)據(jù)集上也刷新了之前業(yè)內最高紀錄,達到了行業(yè)state of the art的技術水平,特別是在CUHK03數(shù)據(jù)集上,Rank 1指標提高了10.7%。
注:以上數(shù)據(jù)由國家超級計算長沙中心,以及長沙市公安局刑事偵查支隊視頻偵查大隊測試驗證。
人臉識別后
千視通用ReID“擦亮”AI天眼
成立于2011年的千視通是一家視頻大數(shù)據(jù)結構化技術提供商。短短七年時間,其已經(jīng)手握500家客戶,在香港、深圳、蘇州、長沙均設有研發(fā)中心,并于上月斬獲近億元A輪融資。
與所有賽道玩家一樣,對于AI技術的深耕與落地是千視通的立業(yè)之本。
如果有人追問,在AI安防市場大局將定的下半場,千視通緣何還能逆風猛進,其CTO胡大鵬博士試圖給出答案。
當包括AI在內的前沿科技成為所有企業(yè)的最強競爭力及核心生產力,那些癡迷于技術的工程師們便取代了此前數(shù)世紀的冒險家們成為商業(yè)之神赫爾墨斯的新寵。
作為一直在學術界耕耘的前沿學者,胡大鵬博士自香港科技大學畢業(yè)后,先后任職北京微軟亞洲研究所、香港中文大學等科研機構。
之后,他帶著在機器視覺技術產業(yè)轉化和應用開發(fā)方面的豐富經(jīng)驗落地安防圈,讓AI技術重塑已經(jīng)塵封多年未做改變的安防市場。
在胡大鵬博士看來,以AI技術為代表的高新科技的發(fā)展為人們提供了越來越多的可能性。 它與傳統(tǒng)安防行業(yè)的結合,不僅重新定義了產品的作業(yè)、體驗方式,還不斷顛覆與重塑著整個行業(yè)的價值鏈。
用他的話說,“得益于AI的發(fā)展,新的‘安防’時代正在誕生?!?/span>
2014年前后,成百上千家 AI初創(chuàng)企業(yè)陸續(xù)帶著天賦殺入了這個稍顯禁錮的傳統(tǒng)產業(yè),而后又紛紛折戟收場、炮灰使然。
撫今追昔,當人們還沒來得及反思悲傷,千視通已經(jīng)從新老巨頭的爭食中掘開一條血道,收獲大批客戶、斬獲巨額融資。
而所有的一切原因在胡大鵬博士看來可以總結為一點:持續(xù)在自己最懂的行業(yè)中做最擅長的事。 持續(xù)便是沒有理由的堅持,最懂的行業(yè)無疑則是安防,而最擅長的事便是包括ReID(跨鏡頭追蹤)在內的AI技術。
ReID全稱為Re-identification,是近年來計算機視覺領域的一個重點研究方向。作為人臉識別技術的重要補充,其發(fā)展內核便是在不同視頻中且無法獲取清晰人臉特征信息前提下,機器通過穿著、發(fā)型、體態(tài)等信息將同一個人識別出來,增強數(shù)據(jù)的時空連接性。
八十字描述便準確說明了該技術的發(fā)展意義,但從0到1的研究、發(fā)展、應用過程中,ReID技術經(jīng)歷了較長的蟄伏期。
不同于人臉特征信息的唯一性,ReID技術在運行過程中遇到的難題與人臉識別技術可以說根本不在一個層級。
由于不同攝像設備之間存在差異,行人外觀易受穿著、尺度、遮擋、姿態(tài)和視角等影響,行人再識別是一個既具研究價值同時又極富挑戰(zhàn)性的課題。
在胡大鵬博士看來,“ReID是AI技術在安防行業(yè)縱橫發(fā)展中必過的一道檻,不能因為難所以讓其停滯不前。”
他解釋說,目前人臉識別技術在安防行業(yè)落地較多,同時也的確是發(fā)展所向,但在很多實際場景中,人臉識別技術作用并不突出。
受限于視頻監(jiān)控探頭的安裝高度及密度,在實際運行過程中,它們更多拍到的是行人的頭頂、后腦勺或者側臉。其次,即便拍到人臉,攝像頭拍攝的像素可能不高,尤其是遠景攝像頭里面人臉截出來很可能都沒有32x32的像素。所以人臉識別在實際的重識別應用中很可能有限,無法看清。
相關數(shù)據(jù)統(tǒng)計,目前全國運行的視頻監(jiān)控探頭中,能夠準確、清晰捕捉到人臉特征信息的視頻監(jiān)控攝像頭不到10%。
而這便出現(xiàn)了一個非常棘手且尷尬的問題:視頻監(jiān)控探頭遍地都是,而大部分探頭卻看不清楚人臉,當監(jiān)控中的人走入另外一臺攝像機的監(jiān)控范圍,機器如何辨別“誰”是 “誰”?
“ReID技術便可以很好地解決這個問題?!焙簌i博士說道。
AI通過機器學習輸出的結構化信息,其實本質上是建立了一個多維向量模型。這時候,機器可以給每一個模型一個編號,做跨攝像頭的人形追蹤。
裝載“人形追蹤”技術的監(jiān)控攝像頭可以將一個人的行為軌跡還原;之后,只要出現(xiàn)在任何一臺可以識別人臉的攝像頭中,就可以被輕易鎖定,不會出現(xiàn)“斷片”現(xiàn)象。
和單點監(jiān)控相比,ReID方案通過多組攝像機的軌跡還原及人員比對讓安防工作變得更為立體,方便辦案民警對目標嫌疑人的行為軌跡、出行規(guī)律進行分析,進而為案情線索和實施靈活布控打擊提供依據(jù)。
胡大鵬博士判斷,“現(xiàn)階段大家都在展示視頻結構化,其實更難的是基于跨攝像頭的人形追蹤。該技術的發(fā)展對于安防行業(yè)來說也具顛覆性作用。”
千視通卡視聯(lián)動技戰(zhàn)法
Re-ID+人臉識別助力高效辦案
作為計算機視覺研究的熱門方向,雷鋒網(wǎng)了解到,除了千視通之外,目前包括曠視、云從等廠商已經(jīng)在ReID技術研究上發(fā)力。 但就該技術在過去一段時間的發(fā)展落地來看,不同廠商的技術比拼之間、該技術與人臉識別技術的準確率之間,效果都相差甚遠。
對于不同廠商的技術實力比拼,胡大鵬博士透露,千視通之所以能夠得到比較好的結果,最大的原因則是與傳統(tǒng)的全局表征或設定好的局部分割方法不同。
一、一般算法只考慮了全局、多粒度及水平匯集訊息,而水平匯集訊息主要用于把圖片對齊。在實際的情況下,攝像頭的角度多變,同時人行是非剛體,所以,垂直方向也理應同時考慮。對于此種情況,千視通在網(wǎng)絡設計上開發(fā)了自研的垂直匯集及其關聯(lián)的算法層,用以更好的適應以上情況。
二、針對損失函數(shù)進行改良,千視通的 ReID 算法提出了新的方案,能一方面增大類間距離并同時最細化類內距離。這代表能提高所計算出的高維特征向量的唯一性,并能有效的提高可識別率。
而相較人臉識別技術準確率尚存差距,胡大鵬博士坦言,就ReID技術來說,其數(shù)據(jù)采集特點鮮明:
總結來看,互聯(lián)網(wǎng)無法提供有效數(shù)據(jù),而大規(guī)模搜集又涉及到隱私問題,由于受影響因素復雜多樣且數(shù)據(jù)集規(guī)模小,該技術數(shù)據(jù)獲取難度非常大,算法難度也較大。
也就是說,ReID技術的天然短板讓其在相同時間內不能超過人臉識別技術。
他同時補充說,技術發(fā)展永遠都是單向向上過程,絕無止境,在對于ReID技術的精進上,千視通不會輕言放棄,并于香港成立了AI研究院,投入大量資源進行相關技術研究、攻克。
此外,他還認為,深耕安防產業(yè),做好單一算法的同時,還需要關注其他算法以及產品的最終形態(tài),畢竟這才是與用戶真正接觸的部分,其也決定了產品的實用性及企業(yè)的業(yè)界口碑。
鑒于此,千視通基于多年實戰(zhàn)經(jīng)驗,提出一種卡視聯(lián)動技戰(zhàn)法,結合人臉識別和跨鏡追蹤(Re-ID)各自的特點及優(yōu)勢,以少量的人臉卡口加大量的普通監(jiān)控探頭的部署,既可鎖定嫌疑人身份,又能重現(xiàn)嫌疑人軌跡,這種創(chuàng)新的綜合型技戰(zhàn)法可以較大概率對監(jiān)控范圍進行覆蓋,具有極強的實戰(zhàn)價值,對安防行業(yè)具有顛覆性意義。
知己知彼方能百戰(zhàn)不殆
對于千視通所深耕的安防行業(yè),胡大鵬博士認知非常深刻。
他說,過去幾十年中,安防行業(yè)的快速發(fā)展遇到了諸多阻礙。比如前端智能化不理想,目前國內傳統(tǒng)天網(wǎng)絕大部分攝像頭還是標清和制高點的高清。它們并不能清晰地拍到公安想要的角度的圖像。
比如各個部門之間的數(shù)據(jù)難以打通。中國原有的IT部門都是建立一個一個的“煙囪”?!盁焽枋健奔軜嬕簿褪谴怪钡捏w系結構,每一個IT系統(tǒng)都有自己的存儲和IT設備,以及獨立的管理工具和數(shù)據(jù)庫,不同的系統(tǒng)不能共享資源,不能交付和訪問,形成了資源孤島和信息孤島。
再比如業(yè)務流程難以改變。用戶需要改變原有的作業(yè)模式,針對各個模式去調整工作機制。
與此同時,他也看到了安防行業(yè)未來的一些發(fā)展機會及技術發(fā)展趨勢。
胡大鵬博士分析,以近期即將舉辦的2018北京安博會為例來說,參會各方必將圍繞智慧城市相關的大數(shù)據(jù)、云計算、loT話題展開熱烈的討論。
基于結構化數(shù)據(jù)提取的邊緣計算作為智慧城市效率提升的重要承載,無疑將會成為大會矚目的焦點。
智慧城市數(shù)據(jù)處理中心需要通過邊緣計算的助力,來接受少量、精準、無損的結構化視頻數(shù)據(jù),減緩帶寬壓力,節(jié)約系統(tǒng)存儲和計算資源,輔助信息快速檢索、定向數(shù)據(jù)挖掘及系統(tǒng)聯(lián)動的實現(xiàn),從而在整體上提升系統(tǒng)的實時響應速度和分析精度。
在大量硬件廠商的支持和投入之下,目前市場上已經(jīng)開始出現(xiàn)了一些低成本、高算力的深度學習運算芯片,能夠把部分算力轉移出來,甚至轉移至前端。
“端+云”方案不僅僅是將算力轉移這么簡單,它能讓前/后端發(fā)揮它應有的功能,前端感知、后端認知,分工明確、算力協(xié)同,從而降低存儲成本、提升數(shù)據(jù)傳輸效率、減輕后端分析壓力,提升人工智能生態(tài)系統(tǒng)綜合服務能力。
對于未來的發(fā)展目標及規(guī)劃,胡大鵬博士表示會堅定“技術落地,算法先行”戰(zhàn)略。
無論市場上有何聲音,千視通依然會與精度“較勁”、依然會在AI安防上持續(xù)深耕,解鎖更多業(yè)務場景。
(來源:雷鋒網(wǎng))