导读 Mozilla继续开发的辅助项目之一是DeepSpeech,这是一种由百度研究得出的语音转文本引擎,并在TensorFlow之上构建,具有CPU和NVIDIA CUDA加速功能。本周标志着Mozilla DeepSpeech 0.6的发布,该版本进行了性能优化,Windows构建,简化了语言模型以及其他更改。

DeepSpeech 0.6目前已为该开源语音转文本引擎实现了7.5%的单词错误率。新版本进行了各种API更改,通过TensorFlow 1.14 cuDNN RNN支持为其训练图提供了更好的训练性能,将语言模型缩减为使用前50万个单词,并添加了各种数据增强技术,一种用于大容量转录大型音频文件的工具,以及其他各种变化。

那些想尝试DeepSpeech 0.6从音频文件转录语音的人可以从GitHub获取二进制版本。 Mozilla Hacks博客上还有关于DeepSpeech 0.6改进的更多详细信息。

原文来自:

本文地址://gulass.cn/mozilla-deepspeech-0-6.html编辑:roc_guo,审核员:清蒸github

Linux大全:

Linux系统大全:

红帽认证RHCE考试心得: