Skip to content

智能語音應用

 

AI(人工智慧)與智能語音之間的關係密不可分,智能語音系統正是人工智慧在語言理解、聲音處理與人機互動上的具體應用之一。從語音辨識、語音合成到語意理解與對話邏輯,整個智能語音流程都倚賴 AI 各種子領域的支援。

 

主要檢測範圍:

TTS(Text-to-Speech)語音合成測試

  • 測試內容:

    • 發音自然度(Naturalness)

    • 音調與語調準確性(Prosody, Intonation)

    • 語音清晰度與可懂度(Intelligibility)

    • 音質(MOS 或 PESQ 分數)

  • 方法:

    • 主觀測試(例如聽測問卷)

    • 客觀分析(聲學參數匹配)

STT(Speech-to-Text)語音辨識測試

  • 測試內容:

    • 語音輸入準確率(語音轉文字能力)

    • 敏感詞辨識或特殊詞彙準確性(例如品牌名、方言)

  • 方法:

    • 提供標準語音資料庫進行辨識

    • 與正確文字比對後計算辨識錯誤率(WER)

    • 使用一組語音樣本,由 STT 系統產生文字結果後,與正解文字進行比對

喚醒字測試(Wake Word Testing)

  • 評估項目:

    • 喚醒準確率(Wake-up Rate)

    • 誤喚醒率(False Acceptance Rate)

    • 喚醒延遲(Wake-up Latency)

  • 環境測試情境:

    • 多方向聲源

    • 背景噪音情境(咖啡店、車內、客廳等)

語音指令測試(Command Recognition Accuracy)

  • 內容:

    • 特定功能指令辨識正確率(如「播放音樂」、「關閉燈光」)

    • 語意理解(NLU)正確率

遠場語音測試(Far-Field Voice Testing)

  • 測試場景變數:

    • 距離(0.5m、1m、3m、5m)

    • 角度(0°, 45°, 90°, 135°)

    • 背景噪音(60dB~75dB)

  • 重點:

    • 信噪比(SNR)

    • Beamforming 效果

    • 回音抑制與降噪表現


 

主要服務項目:

  • Google Gemini
  • Amazon Alexa
  • Microsoft Azure Speech

speechnewnew