Kaldi之父Daniel Povey博士:发布k2核心代码

2023-09-17 17:25:00
aiadmin
原创
1689

11月15日,第五届Kaldi技巧调换会正在北京举办。Kaldi之父Daniel Povey博士初次亲临现场,与来自北京各大互联网公司、出名高校的开垦者们长远调换下一代Kaldi社区他日的开展。

插足小米一年,Daniel Povey策画并开垦出了新一代Kaldi。新一代Kaldi分成三个一面,包含核默算法一面,锻炼数据计算一面、示例剧本会集一面。

个中,Lhotse(锻炼数据计算一面)将取代以前Kaldi中所少有据计算干系的处事,操作百般音频和文本的元数据。Lhotse除了Kaldi自己,也实用于其他使用。况且Lhotse纯Python代码,容易易用。

Icefall(示例剧本会集一面)将庖代Kaldi中的示例剧本会集,并独立成为一个零丁的子项目。之以是要把示例剧本会集与核默算法分散,是商量到示例剧本恐怕会尽头伟大,且通常转移。

据先容,新一代Kaldi的主旨一面叫“k2”。k2可能闪开发者很容易正在PyTorch/TensorFlow中实行百般语音识别干系算法,比方CTC、LF—MMI、RNN—T、2nd—pass说话模子等,毁灭以往语音识别算法中锻炼跟解码不配合的题目。

同时,通过k2可能尽头容易实行(置信度渐渐普及的)众轮解码历程,这正在以往是很难做到的。相较于其他极少语音识别库的上风,k2速率更疾,通用性强(可能用来筑模众种语音识别算法)。

Daniel Povey博士揭发,k2主旨代码已完毕。约41000行代码(首要是C++),本周刚颁布0.1版本。

材料显示,Daniel Povey博士目前担当小米集团语音首席科学家,由他开垦和庇护Kaldi 集成了众种语音识别模子,公认是业界语音识别框架的基石。

联系我们
联系人: 王先生
电话: 15640228768
微信: 1735252255
地址: 沈阳市铁西区兴华南街58-6号