在2008年美国国际消费电子展(CES 2008)上,比尔•盖茨在演讲中描述了下一个“数字十年”的发展趋势,将智能语音技术视为未来技术发展三大关键趋势之首,认为智能语音将带来人机交互模式的根本性变革。 语音技术作为人机交互的重要方式,作为战略性和前瞻性的重要新兴产业,语音技术市场领域一直是国内外科学界和产业界的关注焦点和竞争热点,世界各国都力争取得关键技术突破,占据产业先机位置,并取得对语音产业的领导权。随着导航、手机等移动信息终端和学习机、MP3等便携式消费电子产品的日益普及,语音技术在嵌入式设备中的应用也越来越广泛,语音技术开始真正走进了千家万户。 那么,目前嵌入式语音技术应用表现在哪里?未来,嵌入式应用又该向何处发展?带着这些问题,我们将为你一一揭开嵌入式语音技术应用的神秘面纱。
嵌入式语音技术应用现状 嵌入式产品的应用无处不在,语音技术的加入让嵌入式产品能“听”会“说”,变得更加智能和方便。特别是嵌入式产品体积受限,“看”屏幕信息不方便,利用语音技术“听”信息和语音命令操作机器,将嵌入式产品的便携性和实用性完美的结合起来。典型的应用环境包括以手机为代表的移动通信环境、以GPS导航为代表的汽车环境和以MP3/MP4、学习机为代表的随身电子数码娱乐环境。目前,嵌入式语音技术应用主要表现在:
以GPS导航为代表的汽车环境 语音技术在车载导航行业中的应用,充分考虑了车载导航应用领域的语音需求,提升了语音合成与语音识别在车载条件下的效果,并针对该行业的应用需求提供全方面的解决方案。有了语音合成,千变万化的道路名称,随时到来的路况信息、区域信息,都能及时准确播报;有了语音识别,目的地设定、路况信息查询,只要说出命令就可以实现操作,真正解放了双手,大大提高了驾驶的安全性。 未来,语音系统将成为车载内信息获取、互动娱乐、程序操控的重要工具,真正成为车载设备综合控制终端,解放驾驶者的双手,为改善行车安全、提升车载娱乐价值、促进车载信息化发挥举足轻重的作用。
以手机为代表的移动通信环境 现在,手机“能听会说”早已不是一件稀奇的事。手机不再受屏幕大小、常处于移动状态、信息容量大难以获取的限制。语音交互的手机,使用更加方便、时尚。通过语音合成技术实现来电播报、短信播报、电子书朗读以及语音提醒、语音报时等功能。通过语音识别实现语音拨号、语音检索、语音命令操作手机等功能。朗读效果清晰、自然,语音识别效率高、反应快、实用性强。 随着科技的快速发展和3G时代的到来,智能化、人性化已成为了手机发展的主要方向。“能听会说”功能为手机行业带来了革命性变化,彻底改变了人与手机之间的交互方式,使人与手机之间的“沟通”变得更加自然与顺畅。
以电子词典、数码电子为代表的随身学习、娱乐环境 语音技术在以学习机为代表的教育行业中的应用,让所见即所听,特别对于不清楚单词发音,不清楚句子如何连贯朗读情况下尤为重要。教育电子行业所采用的语音系统在字词覆盖率和多音字合成准确率方面有较大的提升,朗读更准确流畅。语音合成技术的应用,实现中英文混读、英文篇章级朗读,以及声韵母和英文音标的朗读;语音识别技术的应用,实现语音搜索、声控命令操作等功能;口语评测技术,让用户可以进行跟读训练,跟读后系统给出分数和检错提示,针对性更强,进步更快。 目前,嵌入式语音技术应用已实现从教育电子行业到MP3/MP4/PMP、数字电视等数码电子领域的渗透。强大的语音功能,使得数码产品的使用价值得到巨大提升,成为新一代数码产品的最大亮点与卖点。“能听会说”的功能将进一步加强消费者与数码产品之间的交流互动,从而为消费者带来更便捷、更时尚的新潮体验。
通过与手机、车载导航、电子词典等嵌入式设备制造厂商的大力合作,科大讯飞的语音技术与应用都得到了快速的提升,同时公司品牌影响力也得到相应的提高。
未来市场发展前景 随着在越来越多的领域,人们对语音交互价值的认识不断深化,并开始习惯使用,语音技术已经从锦上添花的点缀变为实实在在提供给用户便利的重要特性,也成为衡量电子设备智能化的一个重要指标。除了在技术指标方面继续改进外,功能上,语音技术在各行业的全面解决方案将成为未来嵌入式语音技术与应用的发展方向。 目前,嵌入式语音技术应用主要集中在以手机为代表的移动通信应用、以GPS导航为代表的汽车应用和以电子书和电子词典为代表的随身数码娱乐应用。未来,在手机、学习机、车载导航仪等终端设备中的应用开始加速推广的基础上,语音技术在各领域将会得到纵深的发展。在车载领域,语音系统将成为车载内信息获取、互动娱乐、程序操控的重要工具,真正成为车载设备综合控制终端。同时,语音技术将从现在的读书机、学习机、MP3/MP4/PMP、智能玩具等数码终端进入到更广阔的领域,如家用电器、智能机器人等方向。 随着网络的普及以及3G时代的到来,纯粹的单一应用将难以满足用户的需要,融合语音技术、网络应用和其他技术业务于一身的综合应用服务,将会为各行业发展带来新的机遇。 科大讯飞将持续深化对于嵌入式语音技术应用的拓展,真正使智能语音技术走进千家万户,造福亿万百姓生活。
科大讯飞的独特优势 需要在有限的资源(运算和存储资源)环境下完成良好的语音效果(包括语音合成的准确度、自然度等,语音识别的准确度),一直是语音技术在嵌入式环境应用的最大壁垒。同时,由于嵌入式环境的硬件和软件平台千差万别,存在多种硬件平台、操作系统和软件环境,传统的语音系统在适用性和移植性上也难以满足多样的嵌入式环境需求。 因此,系统资源占用、语音合成效果和系统移植性等一直是国内嵌入式中文语音技术厂商研发的重点。在嵌入式语音技术应用上,智能语音技术全球领先的科大讯飞不论是技术上还是市场应用上都具备了突出的领先优势。
综合实力优势 目前,国内手机、车载导航、电子词典等嵌入式设备制造厂商对于语音技术的应用已经达成了广泛的共识,都在积极寻求语音技术提供商。语音技术属于新兴的高科技技术,厂商在寻求合作伙伴时也会重点关注供应商的综合实力。一方面综合实力强的企业在保证语音效果最优的同时,能够让语音合成和识别的差错最低。中文语言博大精深,多音多义字众多,需要专业的团队长期不断的积累和研发,才能保证优秀的朗读效果和准确率。另一方面,从长远考虑,要求技术供应商具有从语音合成到语音识别的全面技术领先,才能保证解决方案的更加完善,和后续产品不断升级的需求。 作为中国最大的智能语音技术提供商,科大讯飞在智能语音技术领域有着长期的研究积累,并在语音合成、语音识别、口语评测等多项技术上拥有国际领先的成果。科大讯飞中文语音合成技术在近年来历届国内、国际权威机构的评测中,主要关键技术指标均名列第一,并被信息产业部确定为中文语音交互技术标准工作组组长单位,牵头制定中文语音技术标准。2006年、2007年、2008年连续三届英文语音合成国际大赛(Blizzard Challenge)荣获第一名。2008年获国际说话人识别评测大赛桂冠,标志着科大讯飞取得了从语音合成到语音识别的全面技术领先。 基于拥有自主知识产权的世界领先智能语音技术,科大讯飞已推出从大型电信级应用到小型嵌入式应用,从电信、金融等行业到企业和家庭用户,从PC到手机到MP3/MP4/PMP和玩具,能够满足不同应用环境的多种产品。科大讯飞占有中文语音技术市场70%以上市场份额,在电信、金融、电力、社保等主流行业的份额更达80%以上,以讯飞为核心的中文语音产业链已初具规模。
“软件+硬件”双重解决方案优势 科大讯飞嵌入式语音技术通过嵌入式语音软件和硬件两种方式提供给客户,不同的应用形式更好的满足了不同客户的需求。 在软件方面,科大讯飞轻量级智能语音交互系统被科技部评为“2007年度国家重点新产品”,已达到大规模产业化的要求。其核心产品为:轻量级语音合成系统Aisound、轻量级语音识别系统Aitalk。针对嵌入式系统资源受限的特点,讯飞轻量级智能语音交互系统通过深入的优化后,不仅保证良好的语音效果,而且在资源占用、可移植性等方面取得了突破性进展。 在硬件方面,科大讯飞语音合成芯片XF-S3011和XF-S4041以及语音合成模块XF-S4240分别属于低端、中端、高端的语音应用产品。语音芯片、模块通过异步串口、I2C、SPI接口接收待合成的文本,直接合成自然、流畅的语音输出。体积小、使用方便,是一套面向各类电子设备的高性价比的语音解决方案。已成功应用于车载GPS调度、车载电话、信息家电、智能仪表、税控机、智能玩具等领域。
市场应用优势 自成立以来,科大讯飞就确立了“顶天立地”的发展战略,“顶天”是保持核心技术国际领先,成为全球著名的语音和语言研究高地;“立地”是将研究成果大规模产业化,推动语音技术进入亿万家庭,造福普通百姓。 近年来,随着科大讯飞语音技术的不断进步,嵌入式应用得到了快速的发展,在车载导航、手机、学习机等主流应用领域应用不断深入。在车载导航领域,公司已经与丰田、西门子、奇瑞、新科等制造厂商进行了合作;在手机终端领域,典型的开发商有三星、多普达、联想、海尔等。在教育电子领域,诺亚舟、步步高、好记星、文曲星等国内前6名的知名学习机品牌商都与科大讯飞建立良好的合作关系;在MP3/MP4/PMP领域,爱国者、0PPO、台电、魅族等知名品牌都是科大讯飞的合作伙伴。 |