شیائومی از نسل جدید هوش مصنوعی MiMo رونمایی کرد
شرکت شیائومی پس از عرضه مدل MiMo‑V۲‑Pro در چند هفته گذشته اکنون دو مدل جدید هوش مصنوعی با نامهای MiMo‑V۲.۵ و MiMo‑V۲.۵‑Pro را معرفی کرده است. این دو مدل نسل تازهای از معماری چندوجهی شیائومی محسوب میشوند که قابلیت پردازش همزمان تصویر، ویدیو و صدا را ارائه میدهند.
به گزارش برنا، برخلاف نسل پیشین که تنها قادر به تحلیل متن و کد بود، مدل MiMo‑V۲.۵ اکنون توانایی درک و تحلیل ورودیهای بصری و صوتی را بهصورت یکپارچه دارد. بهعنوان نمونه کاربران میتوانند تصویر داخل یخچال خود را بارگذاری کرده و دستور پخت دریافت کنند یا از یک ویدیوی آموزشی خلاصهای گامبهگام تهیه کنند.
پیشرفت مدل حرفهای Pro
شیائومی اعلام کرده که نسخه حرفهای یعنی MiMo‑V۲.۵‑Pro در حوزههایی مانند معماری عاملمحور، مهندسی نرمافزار پیچیده و اجرای وظایف بلندمدت جهش محسوسی داشته است. این مدل در بسیاری از بنچمارکهای تخصصیِ مرتبط با ایجنتها و کدنویسی، عملکردی نزدیک به مدلهای برجستهای همچون Claude Opus ۴.۶ و GPT‑۵.۴ ارائه داده است.
طبق اعلام شیائومی مدل MiMo‑V۲.۵‑Pro برای انجام وظایف حرفهای سنگین طراحی شده و قادر است پروژههایی را که انجام آن توسط انسان چندین روز زمان میبرد بهطور خودکار انجام دهد. سرعت این مدل ۶۰ تا ۸۰ توکن بر ثانیه است و هزینه پردازش آن برای هر یک میلیون توکن ۱ دلار برای ورودی و ۳ دلار برای خروجی تعیین شده است.
در مقابل مدل MiMo‑V۲.۵ بهعنوان نسخه عمومیتر و مناسب وظایف روزمره عرضه شده است. این مدل با سرعت ۱۰۰ تا ۱۵۰ توکن بر ثانیه و قیمت کمتر ۰.۴ دلار ورودی و ۲ دلار خروجی همچنان از پردازش چندرسانهای شامل تصویر، صدا و ویدیو پشتیبانی میکند.
هر دو مدل دارای پنجره زمینه یکمیلیونتوکنی هستند؛ قابلیتی که امکان پردازش حدود ۷۵۰ هزار کلمه را در یک مکالمه واحد فراهم میکند.
در آزمون SWE‑bench Pro که معیار مهمی برای ارزیابی توانایی مدلها در حل مسائل واقعی برنامهنویسی است مدل MiMo‑V۲.۵‑Pro توانسته ۵۷.۲ درصد از وظایف را با موفقیت حل کند؛ رقمی که بهطور قابلتوجهی بالاتر از میانگین ۲۵ درصدی سایر مدلهاست. همچنین در معیارهایی مانند τ۳-bench و ClawEval عملکرد این مدل در سطح مدلهای پیشرفته بازار، همچون Claude Opus ۴.۶ و GPT‑۵.۴ گزارش شده است.
با این حال در آزمون چندرشتهای Humanity’s Last Exam این مدل به امتیاز ۴۸ درصد دست یافته در حالی که مدل GPT‑۵.۴ توانسته امتیاز ۵۸.۷ درصد را ثبت کند.
مدلهای جدید MiMo هماکنون از طریق AI Studio شیائومی در دسترس هستند و توسعهدهندگان میتوانند از طریق Xiaomi MiMo API نیز به آنها متصل شوند. شیائومی اعلام کرده که در حال توسعه نسل بعدی مدلهای خود با تمرکز بر استدلال عمیقتر، ادغام پیشرفتهتر ابزارها و ریشهمندی بیشتر در جهان واقعی است.
انتهای پیام/