Xiaomi MiMo-V2.5-Pro nyílt forráskódú lett – átírja az AI-kódolás „elég jó” fogalmát
Amikor az AI modell órák alatt hozza azt, amit a diákok hetekig tanulnak
Elérkezett a pillanat, amikor érezhetően megváltozik az AI világa. Nálunk ez akkor csattant fel, amikor kiderült: a Xiaomi új kódoló modellje 4,3 óra alatt megcsinálta a Pekingi Egyetem féléves Rust fordítóprogram-feladatát. Nem napok alatt, nem hibákkal, amiket embernek kell javítania. Tökéletes eredmény: 233-ból 233 teszt sikeres egy teljesen új, rejtett tesztsoron.
És igen, ez a modell most open source.
Ez nem csak egy cikázó headline. Ez méri a különbséget aközött, amit egyetemisták hetek alatt összeraknak, és amit egy okos AI délután alatt letud. Sőt, felvet egy kulcskérdést minden fejlesztőnek: hogyan építünk mostantól szoftvert?
Több mint benchmark: igazi kihívások
A benchmarkok jók, de nem mondanak el mindent. Ezért izgalmas a Xiaomi három nagy tesztje a MiMo-V2.5-Pro-val.
A fordítóprogram már ismert: nullára sikeres, semmi javítás. De nem állt meg itt.
A videószerkesztő feladat igazán durva. Homályos utasítás: "csinálj egy videószerkesztőt". Nincs részletes spec, semmi. A modell 11,5 óra alatt 1868 tool call-t használt, és kijött egy működő desktop app: több sávos timeline, klipvágás, átfedések, hangkeverés, exportálás. 8192 sor éles kód egy laza promptból. Ez nem sima autokomplettálás. Ez valódi ügynöki gondolkodás.
Az analóg áramkör-tervezés már posztgraduális szint. Alacsony dropout szabályzó 180nm TSMC technológiára. A MiMo ngspice-szel dolgozott, iterált a paramétereken, és egy óra alatt elérte a célokat. A feszültségszabályozás 22-szer jobb lett, a terheléses 17-szer. Ez az a soklépcsős optimalizálás, ami embernél koffeint és tapasztalatot kíván.
Azt köti össze őket, hogy nem csak nyers erő: önjavítás nagy skálán. A fordítóknál a 512. lépésben hiba jött, a modell diagnosztizálta, megjavította a hibás refaktor-passzt, és folytatta egyedül. Ezrek tool call-jei közepette is koherens maradt. Ez az ugrás a "jó benchmark" és a "éles kód" között.
A benchmarkok valósága
Nézzük a számokat – kontextussal.
SWE-Bench Pro-n MiMo 57,2-t hoz, ami centire van a Claude Opus 4.6-tól (57,3) és GPT-5.4-től (57,7). Ez a top liga.
Terminal-Bench 2.0-n MiMo veri a Claude-ot (68,4 vs 65,4). Modellfüggő előnyök.
SWE-Bench Verified-en Claude vezet kicsit (80,8 vs 78,9), de a különbség olyan kicsi, hogy az open source árelőnye számít.
Claw-Eval Pass@3-on MiMo lehagyja a GPT-5.4-et és Gemini 3.1 Pro-t.
Hol gyengébb? HLE vagy GDPVal-AA benchmarkokon, ahol általános okosságot néznek, nem kódmélységet. Ez szándékos: MiMo kódra specializálódott, nem próbál mindenben jó lenni. Ez erősség szoftverfejlesztésnél.
MiMo vs DeepSeek V4 Pro: open source döntés
Két open source óriás verseng a fejlesztőkért, akik top kódolást akarnak API-díjak nélkül. Mindkettő MIT-licensz, HuggingFace-en elérhető.
Kód teljesítmény szoros:
- SWE-Bench Pro: MiMo 57,2 vs DeepSeek 55,4 (+1,8 MiMo)
- Terminal-Bench 2.0: 68,4 vs 67,9 (döntetlen)
- SWE-Bench Verified: DeepSeek 80,6 vs MiMo 78,9 (+1,7 DeepSeek)
Nincs egyértelmű győztes. Feladatfüggő.
Igazi különbség a hatékonyságban:
- DeepSeek V4 Pro: 49B paraméter/token 1,6T-ból
- MiMo-V2.5-Pro: 42B paraméter/token 1,02T-ból
MiMo spórolósabb, ami self-hostingnál aranyat ér: kevesebb memória, gyorsabb inference, olcsóbb infra. On-premise vagy edge esetén ez felgyorsul.
Mi új a V2.5-Pro-ban
A V2-Flash-től a V2.5-Pro-ig nem kis lépés:
- Hosszú távú koherencia: Fordító és videószerkesztő százas lépésekig tartotta a fonalat.
- Ügynöki képességek: Tervez, iterál, hibát keres, javít. A fordító-regresszió tökéletes példa.
- Tool call skálázás: 1000+ call bírja, romlás nélkül. A videós 1868-at tolt ki működő kóddal.
Miért fontos a te stack-ednek
Startupnál vagy kis csapatnál a MiMo-V2.5-Pro open source mindent megváltoztat:
- Költség: Nincs token-díj. Saját infrastruktúra.
- Sebesség: Hatékony paraméterek, gyors commodity hardveren.
- Adatvédelem: Kód a te hálózatodban marad.
- Testreszabás: Fine-tune-olható a te domainodra.
- Kódmélység: Csak arra fókuszál, ami kell.
Ha Vibe Hostingot vagy hasonló cloudot használsz, bedobhatod közvetlen a deployment pipeline-ba: auto kódgenerálás, optimalizálás külső API nélkül.
A nagy kép
Az open source AI nem "ingyen Claude". Ez kontroll, kiszámítható költség, saját eszközök. A MiMo tökéletes fordítója és usable videószerkesztője azt mutatja: elmúltak a demók. Ez éles eszköz.
Nem az a kérdés, hogy veri-e a Claude-ot vagy GPT-t. Hanem hogy kell-e neked saját modell, és mit enged ez, ha te irányítod az inference-t.