听不见的革命：音频编码如何改写数字音乐

五月 25, 2026 audio-compression digital-media perceptual-coding mp3 technical-history infrastructure-engineering innovation web-technology

看不见的魔法：感知音频编码如何改变数字音乐

你打开 Spotify 听歌、下载一首 MP3，或者刷个播客，其实都在用一项大多数人都没听说过的技术。这恰恰是它的厉害之处——它藏在幕后，却改变了整个世界。

曾经的难题：文件太大，传不动

上世纪 80 年代到 90 年代初，数字音频遇到了一个硬伤：文件实在太大了。一分钟未压缩的音频可能就要好几 MB，在当时刚起步的互联网上根本传不动。很多人觉得，压缩音频又想保持音质，这几乎是不可能的事。

但事实证明，办法是有的。

利用人耳的“盲区”

James D. Johnston 的突破，始于一个简单的发现：人耳其实并不完美。它有不少听不见的细节。

在 AT&T Bell Labs 工作的二十多年里，Johnston 研究了“感知音频编码”。这个方法不是硬生生删掉音频，而是找出人耳听不到的部分，把它们去掉。原理听起来有点绕，但效果很实用——比如两个声音同时响起，人耳往往只注意到 louder 的那个；或者高频和低频混在一起时，高频的细节可能被忽略。

他把这些听觉特性变成了数学模型，再写成压缩算法。结果就是：压缩比能达到 10:1 甚至更高，但人耳基本听不出差别。

从实验室走到你的口袋

这项技术后来成了好几个主流格式的基础：

MP3 让数字音乐第一次真正流行起来
AAC 成了 Apple 音乐和很多流媒体的主力格式
视频压缩标准 也受益于同样的思路，让在线视频变得可行

没有这些，YouTube 可能不会出现，Spotify 也很难支撑起来，播客估计还只是小圈子玩的东西。

给现在做网站的启发

对今天做网站、搞域名和托管的人来说，这段历史其实很有参考价值：

效率往往比“完美”更重要。 Johnston 没追求保留每一丝音频细节，而是根据人耳的实际限制做了取舍。现在优化网站也一样——图片压缩、API 响应速度、数据库查询，目标不是最大化数据，而是找到适合使用场景的平衡点。

标准比闭源方案更持久。 MP3 和 AAC 能普及，不只是因为技术好，更因为大家都用、互相兼容。做域名解析、VPS 或者 SSL 配置时，优先选开放标准，往往能省掉很多后期麻烦。

真正改变世界的，往往是看不见的技术。 没人会在饭桌上聊压缩算法，但正是这些底层工作，让今天的音乐、视频和内容分享变得理所当然。

幕后的人

Johnston 在 Bell Labs 待了 26 年，发表了 50 多篇论文，拿了 20 多项专利。后来他去了 Microsoft，继续影响音频技术的发展。他的故事提醒我们：有些贡献不 flashy，但却支撑起了整个行业。

给做技术的人一点提醒

有时候，最有价值的工作不是做个花哨的产品，而是把底层效率做到极致。无论是优化 DNS 查询、减少 VPS 延迟，还是让 SSL 握手更快，这些“看不见”的改进，都决定了服务能不能真正跑得起来。

下次你无感地听一首歌时，不妨想想——有人花了几十年，才让这个过程变得这么轻松。

Read in other languages:

RU BG EL CS UZ TR SV FI RO PT PL NB NL HU IT FR ES DE DA EN