Snowboy 声音识别
本帖最后由 zhaohuarong 于 2018-1-18 11:33 编辑最近研究了一个声音识别的库,叫Snowboy。
github地址:https://github.com/Kitt-AI/snowboy
下面是在Android设备上使用这个识别库的步骤:
1.从github下载代码
$ git clone https://github.com/Kitt-AI/snowboy.git
目前, Snowboy支持下面的平台(目前暂不支持Windows):
[*]all versions of Raspberry Pi (with Raspbian based on Debian Jessie 8.0)
[*]Mac OS X 64bit
[*]Ubuntu 64bit
[*]Android with ARMv7 CPUs
[*]iOS
[*]Pine 64 with Debian Jessie 8.5 (3.10.102)
[*]Intel Edison with Ubilinux (Debian Wheezy 7.8)
2.安装swig
$ sudo apt install swig
3.编译swig wrappers for Snowboy:
$ cd swig/Android
$ make
如果要编译 ARMv8 64位的版本用:
$ make BIT=64
会编译生成下面的ARM交叉编译动态链接库:
jniLibs/
├── arm64-v8a
│ └── libsnowboy-detect-android.so
└── armeabi-v7a
└── libsnowboy-detect-android.so
还有一些Java接口文件
java
└── ai
└── kitt
└── snowboy
├── SnowboyDetect.java
├── snowboy.java
└── snowboyJNI.java
使用Android Studio打开工程: `examples/Android/SnowboyAlexaDemo` 然后运行。
运行起来的截图:
例子自带的模板文件是alexa.umdl,路径是snowboy/resources/alexa/alexa-avs-sample-app
后面需要自己提交样本,然后生成新的模板文件,用以程序加载,就可以识别自定义的声音了。
样本录音在其网站上进行,非常方便:https://snowboy.kitt.ai/dashboard
进入该网页后直接点击“Create Hotword”按钮即可开始录音,需要录三段声音。
录完就可以生成pmdl文件,将该文件替换原有的alexa.umdl文件即可。 {:5_106:}
页:
[1]