2017-06-27 兴富资本

海天瑞声——兴富投资企业

 

        兴富资本在2016年独家挖掘的智能语言行业隐形冠军海天瑞声在2017年5月顺利完成了B轮融资,兴富资本、浙江银杏谷投资等数家人工智能领域知名战略投资者参与了本轮融资,B轮估值较兴富资本参与的A轮估值大幅上涨。在去年入股海天瑞声以后,兴富资本积极帮助公司进行了进入资本市场的筹划、准备和对接,为企业未来IPO上市融资打下了坚实的基础。
        根据《中国智能语音产业发展白皮书》的报告,全球智能语音产业规模在2017年预计能突破100亿美元,而同时我国在这一产业能突破100亿元人民币。
                                                         微信图片_20170518131604                  微信图片_20170518131619
        海天瑞声从1998年进入智能语音行业至今已经有18年的历史。作为中国最早进入到工程化应用语音语料领域的资源供应商,海天瑞声可以提供110多种语言、覆盖全球75个国家和地区的语音语料数据的采集和人工转写标注服务,能够制作45种语言的专业发音词典,图形图像视频音频数据的采集和标注服务之外,还可以根据客户的需要提供一站式的综合数据解决方案,从语料设计,采集,处理,模型训练,语音系统测评测等各个环节的服务,为客户提供全面的解决方案。海天瑞声有点像智能语音产业的‘幕后英雄’,用户看不到,却能时时刻刻体验到。目前市场上的车载语音系统,在悦耳自然的声音背后,就可以发掘到用来训练引擎模型的大规模的音语料库的身影。

 

人机交互作为智能语音的核心技术,通过相互理解的交流与通信让机器理解人类语言,从而可以让机器听从人类的安排。机器“能听会说”的技术重点主要依靠两方面:一是语音识别(能听)和语音合成(能说)引擎开发的技术成熟度,二是用于训练引擎的训练语料的规模和品质,其中包含语音和文本语料两大类。

 

 

人类语言是一个极为复杂的体系,机器对人类语言的理解和识别过程与人类极为不同。在一定程度上,智能语音的两大核心——语音识别和语音合成引擎的开发技术水平已经十分成熟。正因如此,训练语料越来越成为一个提升用户体验的瓶颈。
fwsgbdnhfdmg
        作为最终用户,对语音识别系统的体验不仅要从它的识别速度,更要从识别的精准度两方面来衡量,这就要求开发者从引擎设计运算能力、网络速度以及训练语料的设计水平等多方面进行不断提升,努力破除用户体验的瓶颈。
语音合成引擎是信息处理领域的一项前沿技术,解决的主要问题是如何将文本状态的文字信息转化为可听的声音信息,使以往只能用眼睛看的文字信息,也可以用耳朵来听。通俗地说,就是让电脑开口说话的技术。 

合成语音的自然度和流利度,包括同一句话里的自然停顿,语气正常起伏等能直接感知的指标,与引擎算法设计和语料库,有同等重要的关系。因此,在语料设计方面,就需要考虑到性别年龄口音音色说话速度方言口音等多方面的因素。同时,考虑到成本和计算机运算能力的限制,要用尽可能少的数量覆盖尽可能多的语言现象和发音特点, 这对语料设计者的语言学和语意学的研究积累,也是一个很大的挑战。

 

海天瑞声已建成中国最大智能语音数据资源平台——天籁数据中心,面向全球科研用户,提供免费或极低收费的高品质科研数据,支持智能语音及相关人工智能领域,如自然语音理解,机器翻译等人机交互技术的科研,测试和模型训练的需要。

        我们恭祝海天瑞声在未来能继续保持高速成长,在智能语音领域成为下一位举世瞩目的独角兽创业公司,我们也将积极秉持融资与融智并重的宗旨,为企业创造更多的助力和价值。