音頻監(jiān)控市場(chǎng)現(xiàn)狀您了解多少
點(diǎn)擊次數(shù):2591 更新時(shí)間:2018-07-06
*,音頻監(jiān)控已經(jīng)成為安防行業(yè)的重要組成部分,尤其是近幾年平安城市建設(shè)的推進(jìn)和進(jìn)程的加快,音頻監(jiān)控在城市安防系統(tǒng)中應(yīng)用的越來(lái)越多,特別是在機(jī)場(chǎng)、鐵路、銀行等一些領(lǐng)域,越來(lái)越多的安防工程急需清晰、逼真的影音同步監(jiān)控系統(tǒng),音頻監(jiān)控領(lǐng)域已經(jīng)成為安防行業(yè)的新亮點(diǎn),全國(guó)政法委會(huì)上明確提到“智慧城市不能只有圖像,而沒有聲音”。
目前,在許多場(chǎng)所,音頻監(jiān)控的使用已經(jīng)普及開來(lái)。
公共場(chǎng)所
音頻監(jiān)控在公共場(chǎng)所(公園、校園、高速公路等)中使用已經(jīng)非常廣泛。一套完整的音頻監(jiān)控系統(tǒng)包括聲音采集部分、語(yǔ)音降噪處理部分、網(wǎng)絡(luò)錄音部分、語(yǔ)音對(duì)講部分、聲音智能分析部分。通過音頻監(jiān)控的場(chǎng)景分析來(lái)判斷公共場(chǎng)景下的異常行為,這種技術(shù)是基于各類異常聲音在時(shí)域、頻域的特征,結(jié)合模式識(shí)別的分類方法可以對(duì)異常事件報(bào)警。
特殊場(chǎng)所
國(guó)家在對(duì)一些特殊的場(chǎng)地,場(chǎng)合,要求有視頻必須有音頻同步。例如檢察院同步錄音錄像系統(tǒng)、預(yù)審系統(tǒng)、監(jiān)管系統(tǒng)等。北京地鐵、首都機(jī)場(chǎng)等公共交通樞紐也要有音頻監(jiān)控。音頻監(jiān)控除了功能外,還可以起到預(yù)警作用,如發(fā)現(xiàn)“獄霸打架”。一般人說(shuō)話的聲音強(qiáng)度大都在50分貝以內(nèi),傳播的距離在30米左右,當(dāng)音量高過一定分貝就可以起到報(bào)警作用,為避免造成更大的傷害起到一定的作用。
民用領(lǐng)域
近年來(lái),隨著視頻監(jiān)控的普及,家庭、個(gè)人商鋪等的安防使用監(jiān)控系統(tǒng)越來(lái)越多,而對(duì)于家庭來(lái)說(shuō),監(jiān)控承擔(dān)了防盜,更成為家庭溝通交流的平臺(tái),因此兼具音視頻功能的音頻監(jiān)控設(shè)備是當(dāng)前家庭監(jiān)控的主流。具有音頻采集功能的家庭監(jiān)控,在小偷進(jìn)入家門時(shí),還可以進(jìn)行遠(yuǎn)程喊話,起到預(yù)警作用。
視頻+音頻,推動(dòng)行業(yè)發(fā)展
音頻與視頻的有效結(jié)合能有效提升監(jiān)控質(zhì)量,滿足更多現(xiàn)實(shí)的需求,對(duì)于提升安全系數(shù)、提高破案能力等都有很大幫助。而事實(shí)上,音視頻結(jié)合監(jiān)控也給安防行業(yè)帶來(lái)新的發(fā)展方向。隨著數(shù)字網(wǎng)絡(luò)高清監(jiān)控的發(fā)展和普及,尤其是近兩年來(lái)價(jià)格戰(zhàn)和行業(yè)洗牌,安防行業(yè)的高清視頻已經(jīng)嚴(yán)重同質(zhì)化了,而音頻領(lǐng)域,廠家沒有那么多,在技術(shù)與質(zhì)量也還有很大的提升空間,是值得關(guān)注的方向。
那么音頻監(jiān)控如何融入到視頻監(jiān)控中來(lái)呢?其實(shí),和視頻監(jiān)控一樣,音頻監(jiān)控同樣面臨數(shù)字化智能化的變革。目前,在視頻監(jiān)控領(lǐng)域智能分析是大家看好的方向,而海量的音頻數(shù)據(jù)同樣需要通過智能分析和判別才能更有意義,所以視頻監(jiān)控廠商在發(fā)展音頻方向的同時(shí), 同樣需要加強(qiáng)智能分析方面的能力,而不是停留在存儲(chǔ)的基本功能上。
語(yǔ)音識(shí)別
語(yǔ)音識(shí)別是大家比較熟悉的技術(shù),目前在很多設(shè)備中都有應(yīng)有。比如大家日常用的手機(jī),語(yǔ)音識(shí)別技術(shù)使用已經(jīng)較成熟。語(yǔ)音識(shí)別技術(shù)就是讓機(jī)器通過識(shí)別和理解過程把語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)。語(yǔ)音識(shí)別技術(shù)經(jīng)過幾十年的發(fā)展,基于深度學(xué)習(xí)的人工智能語(yǔ)音將得到大范圍的應(yīng)用。
聲紋識(shí)別
聲紋識(shí)別屬于生物識(shí)別技術(shù)的一種,是一項(xiàng)根據(jù)語(yǔ)音波形中反映說(shuō)話人生理和行為特征的語(yǔ)音參數(shù),自動(dòng)識(shí)別說(shuō)話人身份的技術(shù)。與語(yǔ)音識(shí)別不同的是,聲紋識(shí)別利用的是語(yǔ)音信號(hào)中的說(shuō)話人信息,而不考慮語(yǔ)音中的字詞意思,它強(qiáng)調(diào)說(shuō)話人的個(gè)性,而語(yǔ)音識(shí)別的目的是識(shí)別出語(yǔ)音信號(hào)中的言語(yǔ)內(nèi)容,并不考慮說(shuō)話人是誰(shuí),它強(qiáng)調(diào)共性。
音頻監(jiān)控經(jīng)過多年的發(fā)展,已經(jīng)可以做到通過聲音的識(shí)別來(lái)判斷說(shuō)話人的情緒、所處的環(huán)境等問題。而在音頻監(jiān)控環(huán)節(jié)中,聲紋識(shí)別提供了重要的技術(shù)支撐。目前,聲紋識(shí)別的世界*15.8%,僅次于指紋和掌紋的生物特征識(shí)別,并有不斷上升的趨勢(shì)。
聲音定位
人們經(jīng)常借助聽覺來(lái)判斷發(fā)音物體的位置。例如,當(dāng)你獨(dú)自行走時(shí),突然聽到一個(gè)響聲,你會(huì)立刻判斷出這個(gè)聲音是什么聲音、對(duì)你有無(wú)威脅、它來(lái)自何方等等。確定聲音的方向和距離需要比較來(lái)自兩耳信息,雖然你會(huì)很快做判斷和反應(yīng),但聲音定位過程是聽覺系統(tǒng)復(fù)雜綜合的功能。而監(jiān)控系統(tǒng)中的聲音定位則是通過強(qiáng)度差、時(shí)間差、因色差、相位差等來(lái)實(shí)現(xiàn)的。
音頻場(chǎng)景分析
作為人們感知外界環(huán)境的一個(gè)重要通道,聽覺在視線障礙、不利光照條件等情況中可起到視覺無(wú)法替代的作用,是視覺的重要補(bǔ)充。相比于圖像數(shù)據(jù),音頻信號(hào)往往可使用相對(duì)簡(jiǎn)單的設(shè)備進(jìn)行采集并且占用更少的存儲(chǔ)空間和處理時(shí)間。隨著當(dāng)前移動(dòng)平臺(tái)計(jì)算能力的不斷提高,出現(xiàn)了越來(lái)越多基于音頻的各類應(yīng)用,所涉及的音頻處理算法一直是相關(guān)研究領(lǐng)域的重點(diǎn)。其中,提取、分析和有效利用音頻數(shù)據(jù)所攜帶的語(yǔ)義信息,對(duì)基于內(nèi)容的多媒體檢索、摘要以及開發(fā)上下文自適應(yīng)的應(yīng)用等具有重要意義。音頻場(chǎng)景分析主要是為了分析、決策、預(yù)警所聽環(huán)境下發(fā)生的異常行為。其核心技術(shù)是基于各類異常聲音在時(shí)域、頻域的特征,結(jié)合模式識(shí)別的分類方法對(duì)異常事件報(bào)警。
此外, 在未來(lái)發(fā)展中,還將通過音頻分析能力與技術(shù),把產(chǎn)品從空氣聲學(xué)拓展到固體聲學(xué)領(lǐng)域:鐵路軌道異常聲音檢測(cè)、石油燃?xì)夤艿喇惓B曇魴z測(cè)、橋梁異常聲音檢測(cè)、地震波聲學(xué)檢測(cè)、文博金庫(kù)的墻體聲音報(bào)警等。