Xiaomi MiMo-V2.5-Pro nyílt forráskódú lett – átírja az AI-kódolás „elég jó” fogalmát

Ápr 28, 2026 ai coding models open source development machine learning compiler design software engineering deployment infrastructure developer tools

Amikor az AI modell órák alatt hozza azt, amit a diákok hetekig tanulnak

Elérkezett a pillanat, amikor érezhetően megváltozik az AI világa. Nálunk ez akkor csattant fel, amikor kiderült: a Xiaomi új kódoló modellje 4,3 óra alatt megcsinálta a Pekingi Egyetem féléves Rust fordítóprogram-feladatát. Nem napok alatt, nem hibákkal, amiket embernek kell javítania. Tökéletes eredmény: 233-ból 233 teszt sikeres egy teljesen új, rejtett tesztsoron.

És igen, ez a modell most open source.

Ez nem csak egy cikázó headline. Ez méri a különbséget aközött, amit egyetemisták hetek alatt összeraknak, és amit egy okos AI délután alatt letud. Sőt, felvet egy kulcskérdést minden fejlesztőnek: hogyan építünk mostantól szoftvert?

Több mint benchmark: igazi kihívások

A benchmarkok jók, de nem mondanak el mindent. Ezért izgalmas a Xiaomi három nagy tesztje a MiMo-V2.5-Pro-val.

A fordítóprogram már ismert: nullára sikeres, semmi javítás. De nem állt meg itt.

A videószerkesztő feladat igazán durva. Homályos utasítás: "csinálj egy videószerkesztőt". Nincs részletes spec, semmi. A modell 11,5 óra alatt 1868 tool call-t használt, és kijött egy működő desktop app: több sávos timeline, klipvágás, átfedések, hangkeverés, exportálás. 8192 sor éles kód egy laza promptból. Ez nem sima autokomplettálás. Ez valódi ügynöki gondolkodás.

Az analóg áramkör-tervezés már posztgraduális szint. Alacsony dropout szabályzó 180nm TSMC technológiára. A MiMo ngspice-szel dolgozott, iterált a paramétereken, és egy óra alatt elérte a célokat. A feszültségszabályozás 22-szer jobb lett, a terheléses 17-szer. Ez az a soklépcsős optimalizálás, ami embernél koffeint és tapasztalatot kíván.

Azt köti össze őket, hogy nem csak nyers erő: önjavítás nagy skálán. A fordítóknál a 512. lépésben hiba jött, a modell diagnosztizálta, megjavította a hibás refaktor-passzt, és folytatta egyedül. Ezrek tool call-jei közepette is koherens maradt. Ez az ugrás a "jó benchmark" és a "éles kód" között.

A benchmarkok valósága

Nézzük a számokat – kontextussal.

SWE-Bench Pro-n MiMo 57,2-t hoz, ami centire van a Claude Opus 4.6-tól (57,3) és GPT-5.4-től (57,7). Ez a top liga.

Terminal-Bench 2.0-n MiMo veri a Claude-ot (68,4 vs 65,4). Modellfüggő előnyök.

SWE-Bench Verified-en Claude vezet kicsit (80,8 vs 78,9), de a különbség olyan kicsi, hogy az open source árelőnye számít.

Claw-Eval Pass@3-on MiMo lehagyja a GPT-5.4-et és Gemini 3.1 Pro-t.

Hol gyengébb? HLE vagy GDPVal-AA benchmarkokon, ahol általános okosságot néznek, nem kódmélységet. Ez szándékos: MiMo kódra specializálódott, nem próbál mindenben jó lenni. Ez erősség szoftverfejlesztésnél.

MiMo vs DeepSeek V4 Pro: open source döntés

Két open source óriás verseng a fejlesztőkért, akik top kódolást akarnak API-díjak nélkül. Mindkettő MIT-licensz, HuggingFace-en elérhető.

Kód teljesítmény szoros:

SWE-Bench Pro: MiMo 57,2 vs DeepSeek 55,4 (+1,8 MiMo)
Terminal-Bench 2.0: 68,4 vs 67,9 (döntetlen)
SWE-Bench Verified: DeepSeek 80,6 vs MiMo 78,9 (+1,7 DeepSeek)

Nincs egyértelmű győztes. Feladatfüggő.

Igazi különbség a hatékonyságban:

DeepSeek V4 Pro: 49B paraméter/token 1,6T-ból
MiMo-V2.5-Pro: 42B paraméter/token 1,02T-ból

MiMo spórolósabb, ami self-hostingnál aranyat ér: kevesebb memória, gyorsabb inference, olcsóbb infra. On-premise vagy edge esetén ez felgyorsul.

Mi új a V2.5-Pro-ban

A V2-Flash-től a V2.5-Pro-ig nem kis lépés:

Hosszú távú koherencia: Fordító és videószerkesztő százas lépésekig tartotta a fonalat.
Ügynöki képességek: Tervez, iterál, hibát keres, javít. A fordító-regresszió tökéletes példa.
Tool call skálázás: 1000+ call bírja, romlás nélkül. A videós 1868-at tolt ki működő kóddal.

Miért fontos a te stack-ednek

Startupnál vagy kis csapatnál a MiMo-V2.5-Pro open source mindent megváltoztat:

Költség: Nincs token-díj. Saját infrastruktúra.
Sebesség: Hatékony paraméterek, gyors commodity hardveren.
Adatvédelem: Kód a te hálózatodban marad.
Testreszabás: Fine-tune-olható a te domainodra.
Kódmélység: Csak arra fókuszál, ami kell.

Ha Vibe Hostingot vagy hasonló cloudot használsz, bedobhatod közvetlen a deployment pipeline-ba: auto kódgenerálás, optimalizálás külső API nélkül.

A nagy kép

Az open source AI nem "ingyen Claude". Ez kontroll, kiszámítható költség, saját eszközök. A MiMo tökéletes fordítója és usable videószerkesztője azt mutatja: elmúltak a demók. Ez éles eszköz.

Nem az a kérdés, hogy veri-e a Claude-ot vagy GPT-t. Hanem hogy kell-e neked saját modell, és mit enged ez, ha te irányítod az inference-t.

Read in other languages:

RU BG EL CS UZ TR SV FI RO PT PL NB NL IT FR ES DE DA ZH-HANS EN