شیائومی از نسل جدید هوش مصنوعی MiMo رونمایی کرد

|
۱۴۰۵/۰۲/۰۴
|
۲۱:۵۳:۳۶
| کد خبر: ۲۳۳۳۳۷۸
شیائومی از نسل جدید هوش مصنوعی MiMo رونمایی کرد
برنا - گروه علمی و فناوری: شیائومی با معرفی مدل‌های جدید MiMo‑V۲.۵ و MiMo‑V۲.۵‑Pro وارد نسل تازه‌ای از هوش مصنوعی چندرسانه‌ای شده است.

شرکت شیائومی پس از عرضه مدل MiMo‑V۲‑Pro در چند هفته گذشته اکنون دو مدل جدید هوش مصنوعی با نام‌های MiMo‑V۲.۵ و MiMo‑V۲.۵‑Pro را معرفی کرده است. این دو مدل نسل تازه‌ای از معماری چندوجهی شیائومی محسوب می‌شوند که قابلیت پردازش هم‌زمان تصویر، ویدیو و صدا را ارائه می‌دهند.

به گزارش برنا، برخلاف نسل پیشین که تنها قادر به تحلیل متن و کد بود، مدل MiMo‑V۲.۵ اکنون توانایی درک و تحلیل ورودی‌های بصری و صوتی را به‌صورت یکپارچه دارد. به‌عنوان نمونه کاربران می‌توانند تصویر داخل یخچال خود را بارگذاری کرده و دستور پخت دریافت کنند یا از یک ویدیوی آموزشی خلاصه‌ای گام‌به‌گام تهیه کنند.

پیشرفت مدل حرفه‌ای Pro

شیائومی اعلام کرده که نسخه حرفه‌ای یعنی MiMo‑V۲.۵‑Pro در حوزه‌هایی مانند معماری عامل‌محور، مهندسی نرم‌افزار پیچیده و اجرای وظایف بلندمدت جهش محسوسی داشته است. این مدل در بسیاری از بنچمارک‌های تخصصیِ مرتبط با ایجنت‌ها و کدنویسی، عملکردی نزدیک به مدل‌های برجسته‌ای همچون Claude Opus ۴.۶ و GPT‑۵.۴ ارائه داده است.

طبق اعلام شیائومی مدل MiMo‑V۲.۵‑Pro برای انجام وظایف حرفه‌ای سنگین طراحی شده و قادر است پروژه‌هایی را که انجام آن توسط انسان چندین روز زمان می‌برد به‌طور خودکار انجام دهد. سرعت این مدل ۶۰ تا ۸۰ توکن بر ثانیه است و هزینه پردازش آن برای هر یک میلیون توکن ۱ دلار برای ورودی و ۳ دلار برای خروجی تعیین شده است.

در مقابل مدل MiMo‑V۲.۵ به‌عنوان نسخه عمومی‌تر و مناسب وظایف روزمره عرضه شده است. این مدل با سرعت ۱۰۰ تا ۱۵۰ توکن بر ثانیه و قیمت کمتر ۰.۴ دلار ورودی و ۲ دلار خروجی همچنان از پردازش چندرسانه‌ای شامل تصویر، صدا و ویدیو پشتیبانی می‌کند.

هر دو مدل دارای پنجره زمینه یک‌میلیون‌توکنی هستند؛ قابلیتی که امکان پردازش حدود ۷۵۰ هزار کلمه را در یک مکالمه واحد فراهم می‌کند.

در آزمون SWE‑bench Pro که معیار مهمی برای ارزیابی توانایی مدل‌ها در حل مسائل واقعی برنامه‌نویسی است مدل MiMo‑V۲.۵‑Pro توانسته ۵۷.۲ درصد از وظایف را با موفقیت حل کند؛ رقمی که به‌طور قابل‌توجهی بالاتر از میانگین ۲۵ درصدی سایر مدل‌هاست. همچنین در معیار‌هایی مانند τ۳-bench و ClawEval عملکرد این مدل در سطح مدل‌های پیشرفته بازار، همچون Claude Opus ۴.۶ و GPT‑۵.۴ گزارش شده است.

با این حال در آزمون چندرشته‌ای Humanity’s Last Exam این مدل به امتیاز ۴۸ درصد دست یافته در حالی که مدل GPT‑۵.۴ توانسته امتیاز ۵۸.۷ درصد را ثبت کند.

مدل‌های جدید MiMo هم‌اکنون از طریق AI Studio شیائومی در دسترس هستند و توسعه‌دهندگان می‌توانند از طریق Xiaomi MiMo API نیز به آنها متصل شوند. شیائومی اعلام کرده که در حال توسعه نسل بعدی مدل‌های خود با تمرکز بر استدلال عمیق‌تر، ادغام پیشرفته‌تر ابزار‌ها و ریشه‌مندی بیشتر در جهان واقعی است.

انتهای پیام/

نظر شما
captcha
پیشنهاد سردبیر