人民網

人民網>>財經>>中日技術產業信息網

什麼是聲紋分析?

2014年07月02日08:42    

【相關新聞】

寶潔的“秘密房間”,大數據“智囊”的神奇之處

東京玩具展2014報告:不用線的縫紉機!?

谷歌發布Android Auto,連接安卓手機和車載設備

東京玩具展2014報告:變形、合體,超合金類玩具不同凡響

東京玩具展2014報告:智能手機走進通訊類玩具

“聲紋分析”因東京都議會的言語性騷擾問題而一舉成名。該技術能以非常高的精度鎖定發聲者,是長期以來一直用於犯罪偵查和鑒定等,並不是什麼新技術。另外,這項技術還曾用於一種意想不到的暢銷商品。

近年來,隨著大數據的利用機會日益增多,聲紋也像指紋、基因信息等那樣作為“個人數據”對待的討論越來越活躍。對其也從多個角度進行了研究。

聲紋可表現出發聲器官的差異

那麼,什麼是聲紋?從事聲音鑒定、研發和咨詢等業務的日本音響研究所網站對此有詳細的介紹。該研究所是由日本的聲音研究權威鈴木鬆美設立的民營研究所。下面就對聲紋作簡要介紹。

人類的聲音是多種頻率聲音的集合。把各種頻率的聲音在何時分別含有多少進行視覺化,就會形成像指紋那樣的紋路。每個人的紋路各不相同。由於是聲音的紋路,因此被稱為“聲紋”。

每個人的聲紋各不相同,這是因為,每個人的發聲器官(口腔、鼻腔、聲帶)、嘴唇和舌頭等的形狀都有不同。例如,已知聲音的三要素之一“音色”取決於口腔和鼻腔的容積以及結構(另外兩個要素是“大小”和“高低”)。正因為有這些特點,才能根據聲紋鎖定個人身份。

利用聲紋鎖定個人身份的前提,是與確定為本人聲音的原始數據進行比照。但據稱,即使沒有原始數據,也可以根據聲紋推測出人物肖像。也就是根據聲紋的特點,大致掌握性別、年齡、身高和臉型等。

“狗語翻譯機”也利用了聲紋分析

聲紋主要被用於犯罪偵查和鑒定。由於聲紋與指紋一樣,可以鎖定個人身份,因此還經常用於人體認証。具體如,筆記本電腦和智能手機等便攜終端、金融機構的本人認証、辦公室等的進出管理等。

此外,聲紋還有一個令人意想不到的用途,那就是玩具。具有代表性的是TAKARA公司(現為TAKARA TOMY)2002年推出的狗語翻譯機“Bow-Lingual”。

“Bow-Lingual”  該產品還獲得了“搞笑諾貝爾獎”

Bow-Lingual是一種交流工具,通過對狗叫聲進行聲紋分析,將狗的感情分為“受挫”、“威脅”、“自我表現”、“高興”、“悲傷”、“需求”六種,根據不同的感情,可在屏幕上顯示大約200種語句。由於與狗朝夕相處的主人自己也能了解寵物的感情變化,所以只是對感情進行分類的話並沒什麼意思,將其翻譯成人類的語言估計才是該產品暢銷的原因。2003年,貓語翻譯機“Meow-Lingual”也面世。Bow-Lingual和Meow-Lingual的聲紋分析都採用了前面提到的日本音響研究所的技術。

Meow-Lingual

能否作為個人信息?

雖然聲紋以多種形態在使用,但由於是能鎖定個人身份的信息,應該如何使用目前還在討論中。據《日本經濟新聞》電子版2014年6月16日的《政府將就個人信息大數據運用規定提出修正草案》報道,因為互聯網上大量存在能鎖定個人身份的信息,而以企業為中心,大數據的利用機會在日益增加,因此,日本政府正在討論修改《個人信息保護法》。日本政府的IT綜合戰略本部在6月9日提出的修正草案中規定,聲紋與指紋將和基因信息等一樣,作為個人信息對待。

與指紋和基因信息相比,聲紋是不用特意採集就能輕鬆獲得的數據。雖然非刻意為之,但東京都議會言語性騷擾問題曝光后,聲紋的“威力”還是廣為人知了。隨著用途的擴大,關於對聲紋利用的討論可能還會繼續。(作者:高野 敦,日經技術在線!供稿)

(責編:值班編輯、庄紅韜)

新聞查詢  

新聞回顧

      搜索

產業/經營更多>>

能源/環境更多>>

機械/汽車更多>>

數碼/IT更多>>

電子/半導體更多>>

工業設計更多>>