Jak Internet Explorer próbował oceniać strony za nas (i dlaczego nikt o to nie prosił)
Nieproszeni strażnicy treści – gdy Internet Explorer próbował oceniać cały internet
Pamiętasz czasy, gdy sieć była dzika i nieprzewidywalna? Gdy nikt nie myślał o moderacji, a przeglądarki wierzyły, że da się okiełznać ludzki chaos za pomocą metadanych? To była zupełnie inna era.
Dzisiaj, budując infrastrukturę chmurową i dbając o SEO dla domen, łatwo zapomnieć, że pierwsze przeglądarki miały naprawdę dziwne pomysły na porządkowanie internetu. Jednym z najciekawszych przykładów jest próba Internet Explorera wprowadzenia systemu klasyfikacji treści. To historia o dobrych intencjach i technologicznej naiwności.
Marzenie o uniwersalnym systemie ocen
W latach 90. ktoś w Microsofcie spojrzał na wczesny internet i pomyślał: a może po prostu wszystko ocenimy?
Tak powstał RSACi – system oparty na standardzie PICS, opracowanym przez W3C. Koncepcja wyglądała sensownie:
Strony miały dobrowolnie dodawać metadane opisujące swoją zawartość w czterech kategoriach:
- Violence (od braku przemocy po sceny drastyczne)
- Nudity (od braku nagości po treści jawne)
- Sexual content (od braku treści erotycznych po materiały explicit)
- Language (od braku wulgaryzmów po mocny język)
Administratorzy mogli ustawiać progi w każdej kategorii i blokować dostęp hasłem. Dzięki temu dzieci miały surfować bezpiecznie, bez ryzyka natknięcia się na nieodpowiednie materiały.
Wyglądało to na eleganckie, demokratyczne rozwiązanie. W praktyce okazało się kompletnym nieporozumieniem.
Dlaczego system upadł
Problem z systemami opartymi na dobrowolnym zgłaszaniu się jest prosty – jeśli nikt tego nie robi, cały mechanizm przestaje działać.
Prawie żadna strona nie zaimplementowała RSACi. Gdy włączałeś tę funkcję w IE, miałeś do wyboru:
- Pozwalać na strony bez ocen – wtedy system stawał się bezużyteczny, bo 99,9% internetu nie miało żadnych ratingów
- Blokować strony bez ocen – wtedy mogłeś odwiedzać może 20 stron w całym internecie
Niektóre osoby próbowały ręcznie tworzyć listy dozwolonych i zabronionych adresów, ale takie podejście nie skalowało się poza domowe sieci.
Podstawowy błąd? System zakładał, że właściciele stron będą szczerze oceniać własne treści i dobrowolnie poddawać się ograniczeniom.
PICS – znacznie bardziej skomplikowany niż się wydaje
PICS nie był prostym systemem ocen. To był cały język do tworzenia własnych systemów klasyfikacji – i tak, używał S-expressions, jakbyśmy wciąż żyli w 1987 roku.
Oznaczało to, że:
- Można było tworzyć własne słowniki ocen
- Strony mogły klasyfikować się według wielu systemów jednocześnie
- Jeden nagłówek HTTP mógł zawierać wiele różnych ratingów
- Teoretycznie każdy mógł wymyślić własny system i go używać
Microsoft zaimplementował wszystko w pełni. IE pozwalał dodawać customowe pliki .rat. Domyślnie działał RSACi, ale Windows zawierał również TICRF – tajwański system klasyfikacji z chińskimi znakami. Niestety, Windows XP często interpretował te znakami jako mojibake.
To był imponujący inżynierski osiągnięcie, ale jednocześnie klasyczny przykład rozwiązywania problemu, którego nikt nie miał.
Jak wyglądały te metadane
Aby zobaczyć realny przykład, wystarczy zobaczyć PICS-Label deklarujący, że strona nie zawiera żadnych problematycznych treści:
<meta http-equiv="PICS-Label" content='(PICS-1.1
"http://www.rsac.org/ratingsv01.html"
l gen true
for "http://www.example.com"
ratings (v 0 s 0 n 0 l 0)
comment "Certified safe by our lawyer")'>
Wersuja przez nagłówek HTTP wyglądał podobnie:
PICS-Label: (PICS-1.1 "http://www.rsac.org/ratingsv01.html" l gen true ...)
PICS od początku was flexible – mógł zawierać jednocześnie kilka systemów,评估
PICS od początku był flexible – mógł zawierać jednocześnie kilka systemów, każdy z własnym URI. URI na początku określał, czy oceny dotyczą całego domeny czy tylko pojedynczej strony.
To było kompleksowe i elastyczne. Ale nikt tego nie używał.
IE7 – podwojenie wysiłków
Microsoft nie rezygnował. IE7 wprowadził nowy system – ICRAv3 – wbudowany w osobny plik .rat, nadal wspierając RSACi dla wstecznej compatibility. Dodano nawet podpowiedź do hasła administratora, bo ludzie często je zapominali.
Gdy system blokował stronę, pojawiało się okno dialogowe wyjaśniające, że dostęp został denied na podstawie polityki administratora. Wielu użytkowników zastanawiało się wtedy: „Co to za komunikat? Ja tylko chciałem przeczytać newsy.”
Czego możemy się nauczyć
Historia PICS i RSACi pokazuje kilka ważnych lekcji o standardach webowych i ludzkim zachowaniu:
Nie da się wymusić dobrowolnego compliance. Standardy działają tylko gdy rozwiązują problemy, które ludzie faktycznie chcą rozwiązać. PICS próbował stworzyć rozwiązanie, które szukało problemu.
Metadane na dużą skalę wymagają incentives. Jeśli właściciele stron mieliby prawne konsekwencje za braku oceny, lub jeśli wyszukiwarki depriorytetyzowałyby strony bez ratingów, sytuacja mogła wyglądać inaczej. Ale prośba o dobrowolne self-classification nie działa.
Elegancja techniczna nie oznacza praktycznego adoption. PICS używał zaawansowanego DSL i S-expressions. Ale techniczna sophistication nie pomaga, gdy nikt nie używa systemu.
Content moderation to problem ludzki. Realne rozwiązania w bezpieczeństwie on-line nie są o metadanych – są o active curation, community moderation, user controls i algorithmic assistance.
Legacy
PICS nie żyhtoday
PICS jest dziś technicznie obsolete, ale jego wpływ można zauważyć w P3P – kolejnym standardzie, który również nie zyskał popularności. Współczesne CSP headers i inne HTTP headers mają część inspiracji z PICS.
Jeśli budujesz dzisiaj web properties z NameOcean, nie martwisz się PICS labels. Zamiast tego skupiasz się na:
- Realnej egzekucji content policy
- CSP headers dla security
- Robots.txt dla crawler control
- Standardowych HTTP headers dla caching i security
Te rozwiązania nauczyły się tego, czego PICS nie zrozumiał: prostota, łatwa compliance i alignment incentives z adoption.
Internet Explorer zniknął. PICS został zapomniany. Ale prawdopodobnie gdzieś istnieje komitet standaryzacyjny przygotujący następny system, którego nikt nie będzie używał.
Plus ça change.
Internet poszedł daleko od czasów metadanych i parental controls. Dziś, dzięki NameOcean, skupiamy się na fundamentals – domains, reliable DNS i hosting infrastructure, które naprawdę działają. Bez S-expressions.