提问者:小点点

Watson语音对文本性能的影响


他们看到的Watson语音到文本服务器最近的问题是,无法在单个实例中运行持续时间大于10分钟的音频文件,其次,当运行语音到文本的文件小于10分钟时,有时与Watson服务器的TCP连接丢失。

他们基本上是在python的Watson服务器上使用web套接字,并且想了解对于持续时间较长的音频文件(例如,我们的会议持续到3小时),什么是运行语音到文本的最佳方式。为web套接字上的连接丢失配置瓶颈的最佳方法是什么。


共1个答案

匿名用户

我发现,如果您使用WebSocket,而不要求interim_results,连接就会中断。在问题得到解决之前,一个解决办法是启用interim_results并忽略它们,直到得到最终结果。您可以通过在初始化消息中传递interim_results=true来启用临时结果:

{
  "action" : "start",
  "content-type" : "...",
  "continuous" : true, 
  "interim_results" : true,
  "inactivity_timeout": -1, 
  ...
}