您现在的位置是: 首页 > 多点频道 > 多点资讯 >

Deepgram筹集了1200万美元用于为企业培训定制语音识别模型

Deep Com,Y Combinator的研究生,构建了量身定制的语音识别模型,今天宣布已经筹集了1200万美元的A 轮融资。首席执行官兼联合创始人斯科特·斯蒂芬森(Scott Stephenson)表示,所得款项将促进Deepgram平台的开发,该平台将帮助企业处理会议,电话和演示记录。如果一切都按计划进行-如果Deepgram的规模最终达到竞争对手的水平-则可以通过突出关键成果来节省组织宝贵的时间。
 Deepgram筹集了1200万美元用于为企业培训定制语音识别模型

斯蒂芬森说:“像Alexa和Siri这样的面向消费者的技术已经为语音识别奠定了基础。” “但是...预先建立的语音识别只能让您走到这一步,将资源投入到问题上也无法解决问题。在Deepgram,我们使用端到端深度学习创建了一个完全不同的解决方案,从而产生了更快,更准确和可靠的解决方案,真正满足了企业公司的需求。”
 Deepgram筹集了1200万美元用于为企业培训定制语音识别模型

Deepgram利用后端语音堆栈,该堆栈避免了手工设计的管道进行启发式,基于统计和完全端到端的AI处理,并在配备有强大图形处理单元的PC上训练了混合模型。每个自定义模型都经过全面培训,可以采用从电话和播客到录制的会议和视频等格式的文件来接收文件。

Deepgram处理语音,语音存储在所谓的“深度表示索引”中,该索引按语音而不是单词对声音进行分组。客户可以按其发音方式搜索单词,即使它们拼错了,Deepgram也可以找到它们。
 Deepgram筹集了1200万美元用于为企业培训定制语音识别模型

斯蒂芬森说,Deepgram的模型会自动拾取麦克风的噪音概况,背景噪音,音频编码,传输协议,口音,价位(即能量),情绪,对话主题,语速,产品名称和语言。此外,他声称与行业基准相比,它们可以将语音识别准确度提高30%,同时将转录速度提高200倍,同时可以处理数千个同时的音频流。

很快,随着两个新功能的推出,这些模型将变得更加强大:实时流传输和本地部署。实时流传输使客户可以在说出单词时分析和转录语音,而本地部署将提供Deepgram产品的私有,可部署实例,用于涉及机密,管制或其他敏感音频数据的用例。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。
Top