他们看到的Watson语音到文本服务器最近的问题是,无法在单个实例中运行持续时间大于10分钟的音频文件,其次,当运行语音到文本的文件小于10分钟时,有时与Watson服务器的TCP连接丢失。
他们基本上是在python的Watson服务器上使用web套接字,并且想了解对于持续时间较长的音频文件(例如,我们的会议持续到3小时),什么是运行语音到文本的最佳方式。为web套接字上的连接丢失配置瓶颈的最佳方法是什么。
我发现,如果您使用WebSocket,而不要求interim_results
,连接就会中断。在问题得到解决之前,一个解决办法是启用interim_results
并忽略它们,直到得到最终结果。您可以通过在初始化消息中传递interim_results=true
来启用临时结果:
{
"action" : "start",
"content-type" : "...",
"continuous" : true,
"interim_results" : true,
"inactivity_timeout": -1,
...
}