在过去的一年时间里,5G、AI、无人驾驶等话题颇为引人注目,于此同时,传统的语音技术也一反往常的缓慢进程,开始出现了大爆发linux虚拟机,智能语音成为社会新的宠儿。
提到智能语音,就不得不涉及到一个话题:芯片。芯片作为智能语音产品前进的巨大推力,仍然遭到行业背部企业的注重,而在国外提供音频所需芯片的企业当中,君正较为突出。
君正是国外最早提供IoT和AI音视频整体解决方案的SoC芯片提供商之一。从2014年起,基于君正的SoC芯片解决方案,先后与红米、360、网易、京东智能、苏宁智能、Anker、Harman等国外外品牌厂商合作,被广泛应用在智能穿戴、生物辨识、智能语音和智能视频等物联网领域。
这次,在2019(冬季)中国智能音频产业高峰峰会上,来自君正的罗小明先生发表了关于《基于Linux构建低成本、全功能的"智能语音+"解决方案》的讲演。
以下为讲演实录,内容经我爱音频网()整理和编辑。
智能语音市场迎来风口
语音技术的发展有几六年的历史,为何始终以来没有得到挺好的推广和应用呢?包括微软、苹果和谷歌都在早些年技术出现并没有得到挺好的应用,为何在近几年得到比较大的爆发?
以ECHO这样一个类别来剖析,主要有以下几个方面的语音:
第一是技术上远场拾音。
第二是硬件载体,包括亚马逊和淘宝智能耳机各类形态作为切入点,就能挺好的去教育用户,由于做一个大众化产品用户认知去感知到容易切入这个市场。
第三是渠道,电商平台亚马逊和淘宝都有巨大的流量优势和渠道优势,她们可以挺好的宣传这类的产品,例如亚马逊在网站可以历时三年时间每晚在彩票走势图呈现ECHO这样的产品。
第四价钱门槛方面,当这个产品达到29美元或则国外价达到99人民币的时侯,逻辑上就真正引爆了。
第五AIoT语音辨识率和用户体验达到大幅度得提高,促使整个市场的爆发缘由。
最后是规律,作为一项新兴技术,以虚拟助手为代表的智能语音技术也早已经历了一个完整的技术成熟的周期,2015年把语音的技术放到这个点,2016年置于这个点,到了2018年又有所回升,虽然那种点正式或则早已在成熟公路上。
所以基于这六方面缘由,我们觉得这是市场爆发的诱因。作为一个开发者,我们要做智能语音的产品,会考虑是不是有这种方面的条件帮助产品获得成功。
智能语音技术怎么选型
不仅智能耳机以外,有好多应用场景也有了智能语音应用,无论消费者领域,或则企业应用,甚至政府应用都有好多在落地,只是须要时间去成熟。假如说我们想做一款智能产品,这么是不是可以从这种点切入,找到自己的需求和场景。
通常可供选择的方案
第一linux音频处理软件,由于智能语音技术链条特别长,在前些年做一款智能耳机起码接触到以下的一些合作伙伴,例如硬件平台厂商,要从功能性能成本帧率,后端算法NS、AEC、BF、Trigger,语音技术ASR、NLP、TTS,云平台要从内容服务、智能物联网、开放生态。最多的合作有七八上十家,如今有些厂商把整个算法,找到一个好的厂商就可以完成。从硬件看,我们把硬件平台八的组成为部份,有三大向,有的通用CPU作为技术平台,跑一些应用处理。
第二在特定的场景须要高速运算高音成解决,例如专用DSP解决特定的需求。
第三对一些复杂的场景下可能又须要用到一些复杂的算术,CPU+NPU的方式解决交易的需求。
君正采用的方案
君正现今用的第一种,也早已有第三种方案。
操作方面以Android、Linux和RTOS为主,三种操作系统有其优势和劣势,最终看自己如何规划和定义这个场景,但是我们自己有哪些样的资源完成这个产品的实现,不管Android还是Linux开发难度其扩充性不一样,君正是以Linux为主。
不仅Linux平台,我们有的有单独,例如要技术服务,足够量价钱都比较好谈。不仅后端技术和服务还有费用,包括有一些订制开发费等等。还要考虑云平台开放承受,是否能接受更多的服务满足你特定的一些市场场景需求等。
君正智能音频发展历程
最早2014年,君正跟当时盛大旗下的做了一款Wi-Fi耳机,这是智能耳机一种雏型,主要为了解决蓝牙耳机绑定手机的诱因,你一次配好可以始终在线。
后来的好多产品都属于智能音频应用场景。
比如和易迅唤起语音交互的耳机,以及ALEXA和阿里思必驰用语音唤起、车载场景的产品,包括今年退出里多麦守节的支持远场交互,更多带屏或则带摄像头的场景,还有收音机,猫王收音机有语音控制的收音机,还有带电板的,跟JBL合作,还有车载合作,进ALEXA合作导航。
关于君正解决方案linux音频处理软件,因为这个行业在早期整个产业链比较长,假如一个厂商对接好多厂商不太可行,只能自己去做这部份的工作,我们在后端算法有了好多合作伙伴,不管是硬件算法还是软件算法都有,在语音技术和云平台这块基本上一些大平台在做,百度、腾讯、亚马逊、思必驰等等都有合作。
如今我们主推地芯片平台X1830-Linux,主要方案比较精典,外置NADDFlash。假如你要做一些带摄像头的场景我们也支持MIPI,我们也支持接触屏的场景。
君正“智能语音+”解决方案
在软件方面智能音频场景或则产业链比较长,君正自己会把那些东西做了,包括整个硬件平台、基础系统、核心成立、软件算发都有做承继,顾客假如做一款智能语音产品,只须要做业务逻辑或则云端私有云的开发。
功能特性,功能完整,性价比高,方案成熟,开放可拓展。君正是一个十分开放的公司,是真正提供的基于Linux构建低成本、全功能的"智能语音+"解决方案。
最后Roadmaplinux系统下载,2015年做第一代智能语音操控的耳机,先后推出了四款芯片,如今推进的1630和1830,展厅上基本以这个方案做,支持4耳机,最终我们在去年第三季度推出高性低成本的,四核主屏300兆,我们有比较好的资源,按照顾客资源提供(英语)我们的外置资源,支持多麦,支持摄像头语音+人脸,在Q3推出,待会儿可以跟我们具体了解一下这平台。
本文原创地址://gulass.cn/jyldzdcbqgnd.html编辑:刘遄,审核员:暂无