產品技術

DSpotter應用神經網路技術,提供高辨識率、高抗噪性、低計算資源的離線語音辨識。支援Always listening、Hands-free、Eyes-free等場景。

特色

  • 使用 Phoneme Model 技術,直接輸入文字即可產生辨識指令,不需收集大量語音資料進行訓練。
  • 基於神經網路技術,大幅提升遠距離辨識能力以及對噪音的穩定度。
  • 低功耗的離線辨識,可移植於各SOC、MCU或DSP平台,如ARM CortexM series, CEVA TL3/TL4 series, Tensilica HiFi series,
    Synopsys ARC, Andes RISC-V, RX 等。

支援語言

北京口音中文、台語、粵語、日語、韓語、越南語、土耳其語、英語、德語、法語、義大利語、歐洲西班牙語、俄語等26種語言
支援語言持續更新中,預計每個月新增四國語言

應用

智慧音箱、TWS耳機、車載系統、各項IoT與智慧家電的本地語音喚醒及語音指令。

CSpotter提供關鍵詞辨識技術。支援Always listening,可在連續聲音資料中辨識出欲設定好的關鍵詞,達到Hands-free與 Eyes-free的效用。

特色

  • 使用 Phoneme Model 技術,直接輸入文字即可產生語音指令,不需收集大量語音資料進行訓練。
  • 具備訓練 voice tag 和 speaker verification 辨識能力。
  • 定點數演算法,使用極少的計算資源,可移植於低功耗 32-bit MCU 和 16/24-bit DSP。

支援語言

台灣口音中文、北京口音中文、台語、粵語、日語、韓語、印尼語、馬來語、泰語、越南語、土耳其語、英語、德語、法語、義大利語、歐洲西班牙語、俄語、波蘭語、荷蘭語、拉丁美洲西班牙語、巴西葡萄牙語等34種語言