提问者:小点点

使用w4a格式音频的IBM语音转换为文本(node.js)


Im尝试使用IBM speech to text API在messenger to text脚本中转录音频。

request({
        uri: attachment.url,
        method: 'GET',
        encoding: null
      }, (err, res, audio) => {... do something...}

我使用请求从我在邮件中获得的url获取音频文件。但我只能得到w4a文件,沃森只支持

音频/FLAC

音频/WAV

音频/L16

音频/Ogg

我如何转换w4a格式的音频到wav以适应规格。

还是有别的办法?

多谢了。


共1个答案

匿名用户

使用audiobuffer-to-wav这样的包将您的源音频文件(.w4a)转换为Watson STT兼容的格式,如MP3/WAV,然后将转换后的文件与Watson STT API一起使用。而且,如果您需要使用这个库服务器端,您可以使用web-audio-api包模拟AudioContext功能。