首页 > 编程知识 正文

ld3320语音识别模块工作原理,ld3320

时间:2023-05-05 00:07:27 阅读:164670 作者:2565

一.概要

1 .芯片介绍

LD3320是基于非特定人语音识别(si-ASR )技术的语音识别/语音控制芯片。 提供了真正的单芯片语音识别解决方案。

LD3320芯片集成了高精度的A/D和D/A接口,无需外部辅助闪存或RAM,即可实现语音识别、语音控制和交互功能。 另外,识别出的关键词列表可以动态编辑。

基于LD3320,无论是哪种电子产品,还是包含最简单的51作为主控芯片的系统,都可以轻松实现语音识别、语音控制和交互功能。 为所有电子产品添加语音用户界面(vui )。

2 .语音识别介绍

语音识别ASR技术是基于关键词列表识别的技术。 只需设定想要识别的重要词列表,并以文字发送到LD3320内,就能够识别用户说出的重要词。 用户不需要进行录音训练。

ASR技术最重要的现实意义是提供基于语音的用户界面vui :语音用户界面,远离按钮、键盘和鼠标

识别的过程是将用户说出的语音内容通过频谱转化为语音特征,与这个重要词列表项目一一匹配,最匹配的作为识别结果。 例如,在手机APP中,这个重要的词的列表内容是电话簿上的人名/手机菜单命令/T卡上的歌曲的名字。 不管该列表的条目内容是什么,只要用户设置相关寄存器,就能够将对应的识别对象条目内容作为文字传递给识别引擎。

LD3320可以识别列表中的关键词,用户说的语音是该列表中的任何重要词语,用户在识别之前不需要进行任何训练。 识别引擎不关心关键字列表中关键字的内容,可以是命令、人名、曲名、操作命令等任何汉字字符串。 从算法角度看,每个重要词可以支持的最大字符数限制在30个字符以内。 但实际上,如果用户一口气说出8个以上字符的项目,几乎都会发生错误/脱字/多字/打嗝/停顿等,这些情况会严重影响识别,引起识别错误。 因此,为了获得理想的识别效果,建议每个重要词的字数不要太长,以免影响效果。

3 .技术参数

1 .内置单声道mono 16-bit A/D模数转换

集成2.2通道stereo 16位d/a数模转换器

内置20mW双通道耳机放大器输出

内置550mW单声道扬声器放大器输出

5 .支持并行接口或SPI接口

6 .内置锁定电路PLL,输入主时钟频率为2MHz - 34MHz

7 .工作电压: (VDD: for internal core ) 3.3V

8.48针QFN 7*7标准封装

9 .省电模式功耗: 1uA

4 .应用场景

电磁炉/微波炉/智能家电操作

汽车导航

MP3/MP4

数码像框

机顶盒/彩色电视遥控器

智能玩具/对话玩具

游戏主机

自动售货机

地铁自动售票机

引导机

楼宇电视广告点播

公共照明系统/卫生系统/智能家居语音控制

二. LD3320资料

1 .针脚

转载于:https://www.cn blogs.com/sonny-xby/p/11229234.html

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。