登錄
微信登錄
打開手機微信,掃描二維碼
掃描成功
請勿刷新本頁面,按手機提示操作
中科曙光不會以任何理由要求您轉賬匯款,謹防詐騙
您的微信還未注冊
中科曙光不會以任何理由要求您轉賬匯款,謹防詐騙
您可以同時關注中科曙光微信公眾號
使用微信掃一掃即可登錄! 查閱資料更方便、 快捷!
您已經注冊賬號和
關注微信公眾號
2025年1月
服務熱線:400-810-0466
發布時間: 2022-09-26
紅樓夢中,只有王熙鳳足夠獨特的聲音,才能讓大觀園眾人“未見其人,先聞其聲”。
如今,借助AI語音技術與算法,就算大觀園里有人說英文,有人說德語,依然能“未見其人,先辨其聲”。
這就是聲紋識別,即根據待識別語音的聲紋特征,識別該段語音對應的說話人。聲紋指說話人的語音生物特征,理論上,同指紋一樣,聲紋具有專屬獨特性。目前,聲紋特征也已應用于特定人合成與變聲、特定人分離、特定人喚醒等具體的特定人應用場景。
聲紋識別的核心難點在于系統的魯棒性,即無論語音文本是什么內容、說話人用什么語言、語音信號的時間長短、聲音錄制和傳輸的信道方式、聲音采集時的環境噪聲干擾等都需要能準確識別說話人的身份。在實際場景落地中,如面對智能家居和智能機器人,說話人與智能設備交互時會有一定距離,這就屬于遠場聲紋識別。與近場聲紋識別相比,其信道比更低,且伴隨有混響和噪聲,識別難度更高。目前,許多成熟的算法使得上述聲紋識別的準確率和魯棒性得到了顯著的提高。
文本相關的遠場聲紋數據集
曙光所建設的“全國一體化算力服務平臺”,基于業內首個算網原生資源底座,為聲紋識別技術提供大規模算力算法服務,通過一體化資源協同調度系統,智慧化、定制化地根據作業需求匹配計算資源與環境,可以點對點實現供需雙方的順暢對接。因聲紋識別技術有良好的準確性、經濟性和可擴展性,擁有廣闊的發展空間,將有望大規模應用于金融安全、公共安全、社保生存認證、移動互聯網安全、車聯網安全等各個領域。