行业洞察 | 爱聊天的虚拟人
发布时间 : 2022-11-03 阅读量 : 730
现如今,越来越多的年轻人在电商平台购买“陪聊服务”,尝鲜“虚拟陪伴”,向“陪聊师”倾诉交流、吐露心声。从几十元的“陪聊盲盒”,到上千元的定制“虚拟恋人”。近年来,“虚拟陪伴”服务已成为年轻人在网络上寻求心灵慰藉、吐露心声的时尚自愈。“温柔可爱小甜心”、“霸道独裁总裁”,只要付费都能找到自己喜欢的“人设”。
虚拟人发展的势头如同雨后春笋一般层出不穷。根据亿欧数据库显示,截至2022年9月,我国虚拟数字人赛道投融资金额已超去年,达24.9亿元。而在2015年,这一数字仅为0.33亿元,年复合增长率达到97.71%。如此巨大的市场份额,到底是什么原因让虚拟人如此令人着迷?
市场需求
虚拟角色所带来的世界是未来的、无边界的、技术感的艺术视野。人们可以与虚拟人建立良好的互动关系,与虚拟人之间的爱戴是相互、平等的,J9九游国际通过彼此之间的互动而产生新的想象。人们在虚拟角色身上完成了他们作为观众与自我之间的不停转换。那么虚拟人强大的交互能力到底是如何实现的?
交互能力
虚拟人与人类的交互需要J9九游国际通过文字、语音、视觉的理解和生成,结合动作识别和驱动、环境感知等多种方式,多模态人机交互能够充分模拟人与人之间的交互方式。其中语音识别和语音合成是虚拟人交互的核心功能之一。语音识别的简单定义是使计算机能够识别、理解并将人类语音翻译成文本的技术。也就是让计算机模仿人的听觉系统,能够接收理解输入的语音信号,并输出对应的文字信号。虚拟人的语音识别流程图如下所示:
虚拟人迷人的声线则来自对声优声音的合成,语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬体所实现。文字转语音其流程如下所示:
无论是虚拟人的语音合成还是语音识别算法,都需要海量高质量精标语料库来训练。数据的质量和数量往往决定着深度学习算法优化程度。数据量越大标注越准确,训练出来的虚拟人会越聪明。与人沟通交互会更顺畅,合成的语音会更拟人化。
数据是一切深度学习任务的基石。 拥有海量经由专业录音棚录制的高质量数据集。涵盖天津话、东北话、四川话、上海话、广西话、长沙话众多方言,以及英语、葡萄牙语、韩语等多语种TTS数据。样例如下:
中文女声TTS多情感库:点击了解更多
中文男声TTS多情感库:点击了解更多
广式粤语女声TTS数据集:点击了解更多