MiniMax M2.7 – Så här funkar det på riktigt i ML och kodning
Mindre modeller tar över
AI-världen har ändrat riktning. Istället för att jaga den största modellen frågar många utvecklare nu hur de får rätt jobb gjort till lägsta möjliga kostnad. Det var just den tanken som ledde mig till att testa MiniMax M2.7 som ett alternativ till de stora modellerna.
Jag satte upp en enkel integration mot MiniMax API i min vanliga arbetsmiljö och körde vanliga uppgifter som dyker upp i vardagen. Kaggle-tävlingar, dokumentation i Obsidian och städning av gammal Python-kod blev mina testfall.
Enkel setup för vardagsarbete
För att testa modellen skapade jag en CLI-wrapper som pekade mina verktyg mot MiniMax. Jag satte upp environment variables, valde M2.7 som standardmodell och ökade timeouten för uppgifter som tar tid att köra.
Jag valde MiniMax Plus för 40 dollar i månaden. Den nivån tar bort begränsningar på både context window och antal anrop per dygn. För seriellt utvecklingsarbete är det en stor fördel.
En insikt kom tidigt: när en agent misslyckas är det ofta svårt att veta om problemet ligger i modellen eller i prompten. En bättre modell kan fylla i saknade detaljer, medan en bättre prompt kan göra dem tydliga. Detta är mer en arbetsflödesutvärdering än en vanlig benchmark.
Refactoring av gammal kod
Första riktiga testet blev att modernisera pytorch_tempest, ett ramverk jag byggt med Hydra och PyTorch Lightning. Koden hade blivit gammal. Jag behövde byta ut verktyg, uppdatera type hints, introducera uv för snabbare pakethantering och ta bort teknisk skuld.
Jag behandlade M2.7 som en junior utvecklare. Jag gav tydliga instruktioner, begränsade scope och granskade varje diff innan jag fortsatte. När CI-pipeline bröt hjälpte modellen till att felsöka steg för steg.
Det fungerade bra. Med en bra testsvit som jag kunde köra snabbt kunde jag vara säker på att ändringarna inte introducerade buggar. Men det var viktigt att hålla fast vid narrow prompts och detaljerad review.
Teknisk dokumentation i Obsidian
Min andra uppgift var att skriva och granska tekniska noter för min Obsidian-vault. Detta handlade mer om forskning och syntes av information.
I början använde jag en prompt som fungerade bra för Opus. Den fungerade inte lika bra med M2.7. Jag löste problemet genom att låta M2.7 analysera sina egna utfall och föreslå en prompt som bättre passar sig själv.
Jag byggde två agentic loops: en som skriver noter och en som kritiserar dem. För m2.2.