音频格式 PCM/WAV/MP3 的大小比较(mp3 格式的真实大小仅为其他 2 种格式的 12% 左右)

1、在请求阿里云智能语音交互 – 语音合成的 API 时,其音频编码格式,支持PCM/WAV/MP3格式。默认值:pcm。希望在响应时,响应体尽量小一些,那么需要确认这 3 种格式的响应体大小。

2、在 Postman 中请求接口,当响应格式为 mp3 时,其大小为:187.62 KB 。如图1

图1

3、当响应格式为 pcm 时,其大小为:1.48 MB。如图2

图2

4、当响应格式为 wav 时,其大小为:1.47 MB。如图3

图3

5、发现 mp3 的大小占比仅为其他 2 种格式的 12% 左右。由于此接口是自身服务器的接口(此接口再透传参数至阿里云 API),怀疑可能是由于 mp3 传输恰好被压缩了。不过仔细观察响应头,响应头完全是一样的,尤其是 Transfer-Encoding 的值皆是 chunked(分块编码) 。说明并未被压缩。mp3 格式的真实大小确实仅为其他 2 种格式的 12% 左右了。

永夜