Xiaomi merilis MiMo-V2.5 dan langsung menempatkannya di kelas model AI besar. Model ini sejak awal rampung dibuat multimodal, jadi tidak hanya mengolah teks, meski demikian pun gambar dan video dalam satu sistem. Xiaomi pun menambahkan kemampuan agentic, yang menciptakan model dapat menjalankan tugas yang lebih kompleks tanpa segudang instruksi manual.
Untuk melihat posisinya, Xiaomi membandingkan MiMo-V2.5 memakai beberapa model besar yang telah lebih dulu dikenal. Ada DeepSeek-V4, Kimi K2.6, Claude Opus 4.6, sampai Gemini 3.1 Pro yang dijadikan acuan. Dari hasil yang dibagikan, MiMo-V2.5 terlihat sanggup bersaing, terutama di tugas yang melibatkan eksekusi instruksi.
Salah satu hal menarik muncul di pengujian coding internal mereka. Versi standar MiMo-V2.5 dapat mengejar performa versi Pro, namun menggunakan kebutuhan komputasi yang lebih rendah. Ini menciptakan model tersebut terasa lebih efisien, tidak sekadar mengandalkan ukuran besar.
Di sisi lain, kemampuan memahami gambar dan video demikian pula ikut diuji. Xiaomi menyebut hasilnya setara melalui model closed-source yang selama ini lebih dominan di area tersebut. Artinya, MiMo-V2.5 tidak hanya kuat di teks, namun demikian pula cukup seimbang di berbagai jenis input.
Model ini dilatih memanfaatkan 48 triliun token, angka yang menunjukkan skala pengembangannya. Xiaomi merilis dua varian memakai perbedaan masif di jumlah parameter dan kapasitas aktifnya. Dukungan konteks hingga 1 juta token demikian pula membuatnya dapat menangani input yang panjang tanpa gampang kehilangan konteks.
Soal akses, MiMo-V2.5 memang dapat diunduh dan dijalankan sendiri. Namun, kebutuhan hardware-nya tidak main-main, bahkan GPU kelas atas seperti RTX 5090 masih belum cukup. Pilihan yang lebih masuk akal untuk saat ini ada di API atau AI Studio milik Xiaomi, meski platform tersebut belum selalu stabil.
Xiaomi terlihat tidak hanya ingin punya model sendiri, tetapi serta ikut membuka akses lewat pendekatan open-weight. Ini mampu menarik bagi pengembang yang ingin fleksibilitas lebih kolosal. Menarik demi dilihat, apakah model seperti ini mampu lekas dipakai luas, atau tetap kalah praktis dibanding layanan AI tertutup yang telah lebih dulu mapan.
Sumber













