CRED-1: Så här mäter forskarna verklig domänpålitlighet
Det svåraste med domäner – det som sällan diskuteras
Besökare avgör om en sajt känns seriös eller inte på bråkdelen av en sekund. Det räcker med att titta på adressfältet för att många ska fatta ett beslut. Ändå saknas det bra verktyg för att mäta hur trovärdig en domän egentligen är.
De flesta dataset som finns handlar om prestanda eller SEO. När det gäller trovärdighet får man ofta nöja sig med spamlistor eller ålder på domänen. Det räcker inte långt.
CRED-1 är ett öppet dataset som försöker lösa just det problemet.
Vad innehåller CRED-1?
Datasetet täcker 2 672 domäner och samlar flera olika signaler istället för att förlita sig på en enda faktor. Tanken är att ge en mer nyanserad bild av hur seriös en domän är.
En gammal domän kan ändå vara opålitlig om den saknar närvaro på nätet. En nyare domän med bra teknisk uppsättning kan samtidigt visa tecken på att vara skapad i syfte att lura. CRED-1 tar hänsyn till sådana motsägelser.
Vem har nytta av det här?
Säkerhetsteam kan använda materialet som grund när de bygger filter mot nätfiske eller skadlig e-post. De slipper börja från noll.
DNS- och hosting-leverantörer får bättre insikt i vilka mönster som skiljer seriösa domäner från andra. På NameOcean tittar vi ständigt på hur vi kan skydda infrastrukturen utan att stänga ute vanliga verksamheter.
Forskare får tillgång till strukturerad data utan att behöva betala för proprietära källor.
Startups som bygger säkerhetsprodukter eller ryktestjänster kan testa sina idéer mot verkliga mönster istället för antaganden.
Vilka signaler vägs in?
CRED-1 tittar på flera olika områden samtidigt:
- Hur gammal domänen är och hur den har förnyats
- Tekniska detaljer som SSL och DNSSEC
- Innehållet på sajten och hur konsekvent det är
- Sociala signaler som länkar och omnämnanden
- Historik kring flyttar och ändringar
Genom att kombinera dessa blir det tydligare när en domän sticker ut i någon riktning.
Öppet och tillgängligt
Allt ligger på GitHub och går att ladda ner fritt. Du kan träna modeller, testa algoritmer eller använda datasetet i kommersiella projekt. Det är ovanligt att säkerhetsdata släpps på det här viset.
Praktiska användningsområden
Flera saker går att förbättra redan idag:
- Bättre spamfilter som också väger in domänens trovärdighet
- Webbläsartillägg som varnar innan användaren anger uppgifter
- API:er som validerar domäner vid registrering
- SEO-verktyg som kan sortera bort misstänkta länkar
Varför det behövs
Domain abuse blir allt mer sofistikerat. Samtidigt riskerar legitima verksamheter att fastna i alltför breda filter. CRED-1 är ett försök att göra bedömningarna mer precisa istället för att blockera för säkerhets skull.
Som hosting-leverantör ser vi båda sidorna. Vi vill skydda plattformen, men samtidigt ge seriösa kunder möjlighet att växa utan onödiga hinder.
Kom igång
Börja med att titta på GitHub-repot. Bekanta dig med hur signalerna är definierade och hur datan är strukturerad. Testa sedan en specifik fråga du vill ha svar på. Bidra gärna tillbaka om du hittar förbättringar.
Framtiden
Version 1.0 är bara början. Kommande versioner kan inkludera fler domäner, realtidsdata och branschspecifika modeller. Allt beror på vad communityn bidrar med.
Avslutning
CRED-1 löser inte hela problemet med domänförtroende, men det ger en konkret grund att bygga vidare på. Öppen data gör det möjligt för fler att utveckla bättre verktyg – något som gynnar både leverantörer och slutanvändare.
Har du koll på vilka signaler som faktiskt påverkar hur din domän uppfattas?