智能語音應用
AI(人工智慧)與智能語音之間的關係密不可分,智能語音系統正是人工智慧在語言理解、聲音處理與人機互動上的具體應用之一。從語音辨識、語音合成到語意理解與對話邏輯,整個智能語音流程都倚賴 AI 各種子領域的支援。
主要檢測範圍:
TTS(Text-to-Speech)語音合成測試
-
測試內容:
-
發音自然度(Naturalness)
-
音調與語調準確性(Prosody, Intonation)
-
語音清晰度與可懂度(Intelligibility)
-
音質(MOS 或 PESQ 分數)
-
-
方法:
-
主觀測試(例如聽測問卷)
-
客觀分析(聲學參數匹配)
-
STT(Speech-to-Text)語音辨識測試
-
測試內容:
-
語音輸入準確率(語音轉文字能力)
-
敏感詞辨識或特殊詞彙準確性(例如品牌名、方言)
-
-
方法:
-
提供標準語音資料庫進行辨識
-
與正確文字比對後計算辨識錯誤率(WER)
- 使用一組語音樣本,由 STT 系統產生文字結果後,與正解文字進行比對
-
喚醒字測試(Wake Word Testing)
-
評估項目:
-
喚醒準確率(Wake-up Rate)
-
誤喚醒率(False Acceptance Rate)
-
喚醒延遲(Wake-up Latency)
-
-
環境測試情境:
-
多方向聲源
-
背景噪音情境(咖啡店、車內、客廳等)
-
語音指令測試(Command Recognition Accuracy)
-
內容:
-
特定功能指令辨識正確率(如「播放音樂」、「關閉燈光」)
-
語意理解(NLU)正確率
-
遠場語音測試(Far-Field Voice Testing)
-
測試場景變數:
-
距離(0.5m、1m、3m、5m)
-
角度(0°, 45°, 90°, 135°)
-
背景噪音(60dB~75dB)
-
-
重點:
-
信噪比(SNR)
-
Beamforming 效果
-
回音抑制與降噪表現
-
主要服務項目:
- Google Gemini
- Amazon Alexa
- Microsoft Azure Speech