Kunskapsgrafer: Den dolda kraften bakom nästa generations AI-utveckling
Problemet med kontext i dagens utveckling
Du har säkert stött på det här: du ber Claude eller någon annan AI-assistent om hjälp med en funktion, och den levererar kod som funkar. Men något saknas. Den förstår inte riktigt hur ditt system hänger ihop. Den vet inte att din HTTP-klient är den centrala noden som binder ihop halva kodbasen, eller att din autentiseringslösning har en oväntad koppling som kan skapa problem.
Det är just det här Graphify är till för. AI-modeller är bra på att skriva kod bit för bit, men de saknar ofta en översikt över hela systemet — särskilt när det sträcker sig över flera språk, dokumentation, forskningsartiklar och arkitekturdiagram.
Vad Graphify gör
Graphify fungerar som en semantisk indexerare för din kodbas. Den bygger inte bara en lista över filer utan skapar en interaktiv kunskapsgraf som visar hur olika delar hänger ihop, pekar ut kritiska integrationer och avslöjar överraskande beroenden.
Verktyget använder tre starka tekniker:
Statisk analys möter semantik: Graphify använder Tree-sitter för att extrahera abstrakta syntaxträd och anropsgrafer från över 19 programmeringsspråk. Samtidigt använder den LLM:er för att förstå syftet bakom koden, inte bara strukturen.
Flerlägesförståelse: Graphify hanterar inte bara kod utan tar också in Markdown-dokument, PDF:er, diagram och bilder. Det gör att den kan koppla din kod till forskningsartiklar, arkitekturdiagram och designdokument i samma graf.
Smart gruppering: Med hjälp av Leiden-klustringsalgoritmen grupperar Graphify komponenterna automatiskt i naturliga "communities" utan att använda vector embeddings. Det håller processen snabb och lätt att förstå.
Från rådata till användbar insikt
Processen går igenom sju steg:
- Upptäck — Samla alla relevanta filer från repositoryt
- Extrahera — Parsea AST:er och använda LLMs för att dra ut semantisk mening från dokument
- Bygg — Slå samman allt till en NetworkX-graf
- Klustra — Identifiera naturliga grupper av relaterad kod
- Analysera — Hitta "god nodes" och markera oväntade beroenden
- Rapportera — Skapa en läsbar granskningsrapport med insikter
- Exportera — Skapa interaktiva HTML-visualiseringar, JSON och Obsidian-kompatibla format
Resultatet är att du inte längre ger din AI en rå kodbas att famla igenom. Istället får den en färdigbearbetad kunskapsgraf. När du vill ha en ny funktion har din AI redan rätt kontext.
Verkliga exempel
Projektet kommer med två case studies som visar hur effektivt detta är:
HTTPx (ett litet bibliotek): 6 Python-filer blev 144 nodes, 330 edges och 6 semantic communities. Grafen visade direkt att Client, AsyncClient och Response är de centrala delarna. Men den avslöjade också en överraskning — DigestAuth har en direkt koppling till Response, vilket mö