Kaldi之父Daniel Povey博士:发布k2核心代码
- 2023-09-17 17:25:00
- aiadmin 原创
- 1689
11月15日,第五届Kaldi技巧调换会正在北京举办。Kaldi之父Daniel Povey博士初次亲临现场,与来自北京各大互联网公司、出名高校的开垦者们长远调换下一代Kaldi社区他日的开展。
插足小米一年,Daniel Povey策画并开垦出了新一代Kaldi。新一代Kaldi分成三个一面,包含核默算法一面,锻炼数据计算一面、示例剧本会集一面。
个中,Lhotse(锻炼数据计算一面)将取代以前Kaldi中所少有据计算干系的处事,操作百般音频和文本的元数据。Lhotse除了Kaldi自己,也实用于其他使用。况且Lhotse纯Python代码,容易易用。
Icefall(示例剧本会集一面)将庖代Kaldi中的示例剧本会集,并独立成为一个零丁的子项目。之以是要把示例剧本会集与核默算法分散,是商量到示例剧本恐怕会尽头伟大,且通常转移。
据先容,新一代Kaldi的主旨一面叫“k2”。k2可能闪开发者很容易正在PyTorch/TensorFlow中实行百般语音识别干系算法,比方CTC、LF—MMI、RNN—T、2nd—pass说话模子等,毁灭以往语音识别算法中锻炼跟解码不配合的题目。
同时,通过k2可能尽头容易实行(置信度渐渐普及的)众轮解码历程,这正在以往是很难做到的。相较于其他极少语音识别库的上风,k2速率更疾,通用性强(可能用来筑模众种语音识别算法)。
Daniel Povey博士揭发,k2主旨代码已完毕。约41000行代码(首要是C++),本周刚颁布0.1版本。
材料显示,Daniel Povey博士目前担当小米集团语音首席科学家,由他开垦和庇护Kaldi 集成了众种语音识别模子,公认是业界语音识别框架的基石。
联系我们
联系人: | 王先生 |
---|---|
电话: | 15640228768 |
微信: | 1735252255 |
地址: | 沈阳市铁西区兴华南街58-6号 |
-
思陌产品
深度学习系统产品介绍 -
使用帮助
使用手册 -
关于我们
公司简介 -
资讯反馈
交流论坛 -
联系我们
Tel 15640228768 QQ/WX技术支持 1735252255