配音演员慌了：这项技术能轻松模拟你的“声纹”

位于美邦加州的首创企业ObEN，不妨供应疾捷、无误的电音模仿工夫。用户只须要念上两分钟由ObEN指定的文字，他们的电音就能被模仿出来，而且被用正在唱歌、朗读、用一共能够遐念到的说话做一共或许的事变。

ObEN团队的另一项三维图像重修工夫，还不妨疾捷地通过一张自影相片为消费者竖立三维人脸模子，让虚拟宇宙与实际宇宙之间的间隔，更进一步。

比方将家里小伴侣的声响记实下来，而这个声响模子，能够无间保存到他长大成人，还能够说新的内容；比方片子正在海外放映时，能够应用由明星原声而修制的外文配音，让他们自己的声响也能顺手“出口”；而对时尚博主们来说，别说采访韩邦、欧美明星了，就算时尚博主们进军印度、土耳其、乃至非洲，也能够轻松用外地说话举办采访。此外，人们与家人分开两地时，也能够通过这项工夫，正在种种智能装备中听到亲人熟谙的声响。海角若比邻，不再是一种遐念。

这些远景，让ObEN仍旧胜利和各个行业企业实现了互助意向，个中包含与美邦最大的玩具公司互助开垦智能玩具，跟好莱坞最大的配音公司以及片子公司互助等等。

固然有了以上种种可预料的远景，电音模仿工夫，听起来仍然有些空洞。的确来说，ObEN是如许做到给消费者的声响供应种种应用计划的。

开始，这项业界领先的工夫大大缩短了发声模子的练习年光。也便是说，消费者们只须要花上2-3分钟念出指定的文字，ObEN就能通过人工智能范围的呆板研习工夫，修制出消费者的专属电音模子。这就像每小我有着特殊的指纹相似，ObEN不妨通过深度研习，获取每个用户的“声纹”。要知晓，此刻市情上一齐的专属发声模子都惟有少数人能够体验，而且须要好几天、乃至几周的年光录入数据。

再者，有了这个电音模子，ObEN能够做到让消费者自己的电音，用中文、日语、韩语、以至宇宙上任何一种仍旧存正在的说话言语、唱歌、朗读等等，而非部分于源声响的说话品种及用法。试念，一个齐全不懂中文的美邦白人，能够用他的本身的电音唱秦腔；一个中邦人，也能够听到本身唱出的宝莱坞歌曲了。

ObEN的声响模仿工夫背后，有着UCLA（加州大学洛杉矶分校）以及CalTech（加州理工学院）两所重量级院校的推算机人才们。正在确定开垦这个工夫后，ObEN的两位Co-founder Adam Zheng与Nikhil Jain邀请到了UCLA的声学探求所所长Abeer Alwan以及CalTech的高级推算机科学家Julian Bunn互助开垦。这两位教学，以及他们的其他互助伙伴与博士生们，都为ObEN正在自决研发声响模仿工夫的进程中供应了首要助助。

开始，种种呆板人的拟人化，将由于不妨接入的确、可控的声响模子而愈加胜利。一个的确的例子便是正在本年的CES岁月，ObEN和凯撒文娱集团以及微信举办互助，正在凯撒文娱旗下客栈里，供应名为“Ben”的虚拟客服。住正在凯撒文娱集团旗下的LINQ客栈的客人能够通过体贴凯撒文娱集团的微信号，正在手机上跟Ben互动——他不妨以任何声响或说话来举办复兴。

并且，哈工大呆板人集团与ObEN互助也正在LINQ客栈大堂里供应了迎宾呆板人，让虚拟客服Ben“实体化”成了一个看得睹摸得着的呆板人，客人们能够通过与迎宾呆板人的疏导，直接感觉到众说话、众声响的呆板人供应的便捷供职。

再次，声响模仿工夫，将正在虚拟实际范围有着极众起色时机。比方正在虚拟培养范围，当声响来自的确的教师、同砚时，孩子们会更容易浸溺个中；再比方正在虚拟医疗范围，更的确的声响也会让患者愈加轻松。

早正在1946年，美邦粹者埃德加·戴尔提出的“研习金字塔”（Cone of Learning），以及众年来认知科学界的探求，都阐明了当听觉与视觉连结时，人类的明了、研习本领更强，远远横跨惟有听觉、或惟有视觉。

也恰是是以，为了进一步缩短虚拟宇宙与的确宇宙之间的间隔，ObEN团队还开垦了基于手机的写真级的三维人脸重修工夫。声响与图像周密配合，将来的遐念空间极大。

正在过去十几年间，对将来逛戏的一个常睹遐念便是，玩家以几近的确的面容及声响，正在逛戏宇宙里闯荡。

实在，三维人脸重修工夫并非ObEN始创。正在无误度上，应用深度摄像头举办较长年光的扫描，竖立的模子也一定愈加的确。然而这种耗时长、须要深度摄像头的三维重修工夫，念要正在消费者端普及应用，极为麻烦。

是以，ObEN采取了开垦只需应用手机拍摄一张照片，就能由平面照片天生三维人脸模子的工夫。这项工夫基于呆板研习，通过巨额研习二维照片与相应三维模子的闭联而最终成型。当然，假若消费者们应许众供应几张照片，比方侧面照等，也会让ObEN最终外现的三维模子更为无误。

正如上文中提到的，这项工夫正在虚拟实际/巩固实际范围，有着极众或许性，包含培养、医疗、逛戏、安排、音乐等。简直能够说，只消是须要人物的地方，都或许须要。这也意味着ObEN与很众虚拟实际行业内的企业都有着互助或许。

比方正在病院中，比拟一个卡通情景的虚拟医师，患者本身的医师的虚拟情景一定更受患者青睐。正在VR培养范围，假若小伴侣们能望睹、听睹的确的同砚、教师，培养恶果也会好不少。最首要的是，只消消费者们应用ObEN供应的这种三维图像重修工夫，就能轻松地把社会闭联导入到虚拟宇宙里。

这一特性，是当年QQ、微信大火的基本，而有了ObEN，正在虚拟实际范围的杀手级使用，咱们也能有所等待了。

2016年是虚拟实际/巩固实际（VR/AR）的元年，而ObEN的声响模仿工夫与三维图像重修工夫，很有或许成为VR/AR起色的首要助力。

近几年，业界相似夸大虚拟实际中3D音频的首要性。而能够供应差别声响、说话的ObEN，则是正在3D音频工夫之外，补足了虚拟宇宙里声响的“内容”这一个人，让虚拟宇宙里的声响，更具有吸引力。

而声响与图像工夫的连结，也是ObEN以至VR/AR界可预料的首要偏向。ObEN仍旧初阶自行开垦使用，试验将两项工夫连结。他们即将推出的全新的VR/AR相交App，便是希冀不妨“复制”出每个用户的虚拟情景与声响，这意味着无论你正在线与否，都能够跟有着的确虚拟情景的其他用户举办交换。

“咱们以为正在将来，每小我都须要一个与本身情景相符的虚拟宇宙助手，”ObEN的COO Adam Zheng说道。正在VR/AR范围，如许的虚拟宇宙助手能够正在各方面为本身的主人供职。

据领悟，ObEN已入选HTC的Vive X加快器项目，正在一千众个项目中脱颖而出，与其他32家创业公司联合搜索虚拟实际范围的将来或许。据Adam泄露，加快器项目中不少虚拟逛戏公司仍旧对ObEN的这两项工夫外达了有趣。

ObEN设立于2014年，重要创始人永诀为COO Adam Zheng以及CEO Nikhil Jain。个中，Adam是清华大学处境工程硕士、伯克利金融工程硕士、UC Davis交通工程博士。Nikhil Jain具有南加大的MBA学位，是加州地域的贯串创业者。ObEN的首席工程师Dr. Mark Harvilla是卡耐基梅隆的电子工程学博士，曾师从Richard Stern（Apple Siri的掌握人Alex Acero的导师，李开复的博士结业论文引导教学之一）。

联系人：	王先生
电话：	15640228768
微信：	1735252255
地址：	沈阳市铁西区兴华南街58-6号

思陌产品

使用帮助

关于我们

资讯反馈

联系我们