Jak algorytmy nauczyły nas słuchać mniej, żeby usłyszeć więcej
Niewidzialna rewolucja w kompresji dźwięku
Wystarczy kliknąć play w Spotify albo pobrać plik MP3, żeby korzystać z technologii, o której mało kto słyszał. A właśnie o to chodziło twórcom.
Problem, który wydawał się nierozwiązywalny
Na początku lat dziewięćdziesiątych cyfrowy dźwięk napotykał poważną przeszkodę – pliki ważyły za dużo. Minuta nagrania w jakości CD zajmowała kilka megabajtów. Wysyłanie czegoś takiego przez wolny internet po prostu nie miało sensu.
Inżynierowie zakładali, że nie da się mocno zmniejszyć pliku bez wyraźnej utraty jakości. Wydawało się to oczywiste.
Okazało się, że nie.
Wykorzystanie słabości ludzkiego ucha
James D. Johnston z AT&T Bell Labs spojrzał na problem z innej strony. Zamiast walczyć o zachowanie każdego bitu, postanowił usunąć te fragmenty dźwięku, których człowiek i tak nie jest w stanie usłyszeć.
Działa to prosto. Gdy dwa dźwięki grają w tym samym momencie, głośniejszy zagłusza cichszy. Wysokie tony obok niskich też często znikają z percepcji. Johnston zamienił te zjawiska psychoakustyczne na wzory matematyczne i zbudował na ich podstawie algorytmy kompresji.
Efekt? Możliwość zmniejszenia plików nawet dziesięciokrotnie bez zauważalnej różnicy w brzmieniu.
Od laboratorium do codziennego użytku
Techniki opracowane przez Johnstona stały się podstawą formatów, które znamy do dziś:
- MP3 umożliwił masowe udostępnianie muzyki w internecie
- AAC zasilił ekosystem Apple i do dziś dominuje w streamingu
- Standardy kompresji wideo sprawiły, że YouTube i inne platformy w ogóle mogły powstać
Bez tych rozwiązań Spotify, YouTube czy podcasting w dzisiejszej formie po prostu by nie istniały.
Co z tego wynika dla programistów
Johnston nie próbował zapisywać wszystkiego. Skupił się na tym, co naprawdę istotne dla odbiorcy. Podobne podejście przydaje się przy optymalizacji obrazów, zapytań do bazy czy czasów odpowiedzi API.
Liczy się też standaryzacja. MP3 i AAC wygrały nie tylko dlatego, że były dobre technicznie, ale dlatego, że stały się powszechnie dostępne i kompatybilne.
Człowiek za kulisami
Johnston spędził 26 lat w Bell Labs. Napisał ponad 50 artykułów naukowych i zgłosił ponad 20 patentów. Po odejściu z laboratorium w 2002 roku kontynuował pracę nad architekturą dźwięku w Microsoft.
Jego historia pokazuje, że największy wpływ często mają osoby, których nazwisk nigdy nie zobaczymy na okładkach.
Lekcja dla osób budujących infrastrukturę
Czasem największą wartością nie jest nowy produkt czy funkcja, tylko praca nad tym, co działa w tle – zmniejszanie opóźnień, cięcie zużycia transferu, optymalizacja. To właśnie te rzeczy decydują, czy usługa wytrzyma obciążenie, czy padnie pod własnym ciężarem.
Następnym razem, gdy odtworzysz utwór bez zastanowienia, pamiętaj, że ktoś przez dekady pracował nad tym, żeby ten moment był prosty i bezproblemowy.