产品技术

DSpotter应用神经网路技术,提供高辨识率、高抗噪性、低计算资源的离线语音辨识。支援Always listening、Hands-free、Eyes-free等场景。

特色

  • 使用 Phoneme Model 技术,直接输入文字即可产生辨识指令,不需收集大量语音资料进行训练。
  • 基于神经网路技术,大幅提升远距离辨识能力以及对噪音的稳定度。
  • 低功耗的离线辨识,可移植于各SOC、MCU或DSP平台,如ARM CortexM series, CEVA TL3/TL4 series, Tensilica HiFi series,
    Synopsys ARC, Andes RISC-V, RX 等。

支援语言

北京口音中文、台语、粤语、日语、韩语、越南语、土耳其语、英语、德语、法语、义大利语、欧洲西班牙语、俄语等26种语言
支援语言持续更新中,预计每个月新增四国语言。

应用

智慧音箱、TWS耳机、车载系统、各项IoT与智慧家电的本地语音唤醒及语音指令。

CSpotter提供关键词辨识技术。支援Always listening,可在连续声音资料中辨识出欲设定好的关键词,达到Hands-free与 Eyes-free的效用。

特色

  • 使用 Phoneme Model 技术,直接输入文字即可产生语音指令,不需收集大量语音资料进行训练。
  • 具备训练 voice tag 和 speaker verification 辨识能力。
  • 定点数演算法,使用极少的计算资源,可移植于低功耗 32-bit MCU 和 16/24-bit DSP。

支援语言

台湾口音中文、北京口音中文、台语、粤语、日语、韩语、印尼语、马来语、泰语、越南语、土耳其语、英语、德语、法语、义大利语、欧洲西班牙语、俄语、波兰语、荷兰语、拉丁美洲西班牙语、巴西葡萄牙语等34种语言