AI marnuje tokeny – daj robotę kodowi
Paradoks AI w codziennym kodowaniu
Wiele zespołów programistycznych wpada w pułapkę. Zamiast pisać kod, budują skomplikowane systemy, w których modele językowe mają wykonywać powtarzalne, przewidywalne zadania. Uruchamiają komendy, sprawdzają wyniki, wykonują standardowe procedury. Tokeny lecą, wyniki są różne przy każdym uruchomieniu, a programista i tak musi pilnować, czy AI nie pominęło czegoś ważnego.
To trochę tak, jakby zatrudnić eksperta do wciskania włączników światła.
Dlaczego leniwe delegowanie nie działa
Kiedy prosisz model o uruchomienie SonarQube i analizę wyników, tak naprawdę oczekujesz od niego kilku rzeczy naraz. Ma znać Twój stack, dobrać odpowiednią składnię poleceń, zrozumieć wyjście narzędzia i podjąć decyzje co dalej. Każda z tych warstw to potencjalne źródło błędu. Każde odstępstwo od schematu oznacza dodatkowe tokeny i kolejną rundę weryfikacji.
Efekt? System wydaje się inteligentny, ale zachowuje się chaotycznie.
Powrót do determinizmu
Rozwiązanie jest prostsze, niż się wydaje. Zamiast kazać AI obsługiwać cały proces, warto przenieść przewidywalne części z powrotem do zwykłego kodu.
Chodzi o to, żeby stworzyć rozszerzenie, które:
- Zna strukturę projektu i nie musi jej zgadywać
- Działa zawsze tak samo, bez losowych odchyleń
- Generuje przewidywalne koszty zamiast hazardu z tokenami
- Dostarcza AI gotowe, sprawdzone dane
Dzięki temu model nie traci czasu na interpretowanie wyników poleceń. Dostaje fakty, a nie własne domysły o tym, co się wydarzyło.
Tworzenie własnego workflow
Nie ma sensu kopiować gotowych rozwiązań innych osób. Ich ograniczenia i ich narzędzia rzadko pasują do Twojego przypadku. Warto podejść do tego jak do konfiguracji środowiska — zobaczyć, co inni zrobili, ale zbudować coś pod siebie.
Najlepiej zaczynać od prostych mechanizmów: odczyt plików, zapis, edycja i dostęp do shella. Resztę — logikę biznesową, specjalizowane rozszerzenia — budujesz sam. Wtedy wiesz, co się dzieje, gdy coś działa albo przestaje działać.
Trzy sposoby na oszczędność tokenów
Agresywne cachowanie. Każda wiadomość niesie ze sobą system prompt, definicje narzędzi i historię. Prompt caching pomaga, ale tylko wtedy, gdy używasz go świadomie. Narzędzia typu caveman pozwalają zmniejszyć powtarzalny narzut bez utraty kontekstu.
Ograniczanie listy poleceń. Gdy AI widzi zbyt wiele opcji naraz, zaczyna się mylić. Lepiej podać krótszą, bardziej zwartą listę komend. Mniej wyborów oznacza mniej błędów.
Kompresja lokalna. Zamiast prosić model o skracanie promptów, warto robić to przed wysłaniem — przy użyciu narzędzi, które nie wywołują API. VCC normalizuje strukturę bez dodatkowych kosztów.
Co z tego wynika
Jeden z programistów, który przeszedł z rozbudowanych agentów na deterministyczne rozszerzenia, zniknął z wewnętrznego rankingu zużycia tokenów. Nie dlatego, że przestał używać AI. Po prostu przestał marnować je na rzeczy, które powinny być zwykłymi skryptami.
Jeśli budujesz własny proces lub oceniasz narzędzia typu Vibe Hosting od NameOcean, warto zadać sobie pytanie: gdzie AI wykonuje zadania, które da się zapisać jako kod? Tam właśnie warto wprowadzić determinizm.