جهش تازه چین در رقابت جهانی رباتها با ثبت ۱۶ رکورد هوش مصنوعی فیزیکی
غول فناوری چین با معرفی مدل هوش مصنوعی RynnBrain وارد رقابت جهانی در حوزه هوش مصنوعی فیزیکی شد؛ مدلی که با ثبت ۱۶ رکورد در حوزه رباتیک و عملکرد بهتر نسبت به برخی مدلهای گوگل و انویدیا گامی تازه در توسعه رباتهای دنیای واقعی محسوب میشود.
به گزارش interestingengineering، شرکت علیبابا روز سهشنبه از سامانه هوش مصنوعی جدیدی رونمایی کرد که برای توانمندسازی رباتها و ماشینهای هوشمند در تعامل با محیط واقعی طراحی شده است. این مدل با تمرکز بر درک فضا، اشیا و حرکت، یکی از جدیترین تلاشهای این شرکت برای ورود به عرصه هوش مصنوعی تجسمیافته یا embodied AI به شمار میرود.
تمرکز بر هوش مصنوعی فیزیکی و رقابت جهانی
رونمایی از RynnBrain نشاندهنده افزایش سرمایهگذاری علیبابا در حوزه رباتیک است؛ حوزهای که پیشتر با حضور بازیگران بزرگی همچون گوگل و انویدیا رقابت شدیدی را تجربه کرده است. در ویدئوی نمایشی منتشرشده توسط آکادمی DAMO یک ربات با شناسایی میوهها و قرار دادن آنها در سبد تواناییهای مدل را به نمایش میگذارد؛ فرایندی که در ظاهر ساده است، اما نیازمند تشخیص دقیق اشیا، ردیابی موقعیت و برنامهریزی حرکات در زمان واقعی است.
علیبابا RynnBrain را بهعنوان یک مدل پایه در حوزه هوش مصنوعی تجسمیافته معرفی کرده؛ دستهای از فناوریها که شامل رباتها، خودروهای خودران و ماشینهایی میشود که مستقیما با محیط فیزیکی تعامل دارند. چین نیز در چارچوب رقابت فناوری با ایالات متحده توسعه این حوزه را بهعنوان یکی از اولویتهای ملی خود تعیین کرده است.
حافظه فضازمانی؛ پاسخ به ضعف بزرگ رباتها
تمرکز اصلی RynnBrain بر رفع یکی از ضعفهای مهم مدلهای رباتیک فعلی است: ناتوانی در حفظ حافظه دقیق از فضا و زمان. به گفته علیبابا بسیاری از سیستمهای embodied AI در یادآوری موقعیت اشیا یا تفسیر درست صحنهها دچار مشکل میشوند؛ اما این مدل با بهرهگیری از حافظه فضازمانی قادر است موقعیت گذشته اشیا را به یاد آورده و حرکت آینده آنها را پیشبینی کند.
این سامانه همچنین از قابلیت بازنگری سراسری برخوردار است؛ به این معنا که ربات میتواند پیش از تصمیمگیری بعدی اقدامات قبلی خود را مرور کند و احتمال خطا در وظایف پیچیده را کاهش دهد. ترکیب منطق متنی با نشانههای فضایی نیز امکان استدلالی نزدیکتر به شرایط واقعی را فراهم میکند.
RynnBrain بر پایه سیستم دیداری–زبانی Qwen۳-VL آموزش دیده و با معماری اختصاصی RynnScale بهینهسازی شده است؛ معماریای که به گفته شرکت سرعت آموزش مدل را بدون افزایش منابع محاسباتی دو برابر کرده است.
مدل کوچکتر تصمیمگیری سریعتر
نسخه اصلی این محصول بهعنوان نخستین مدل embodied AI با معماری ترکیب خبرگان و ۳۰ میلیارد پارامتر معرفی شده است. با این حال در زمان اجرا تنها ۳ میلیارد پارامتر فعال میشوند؛ موضوعی که به گفته علیبابا باعث میشود عملکرد آن از برخی مدلهای بزرگتر ۷۲ میلیارد پارامتری نیز بهتر باشد.
کاهش نیاز محاسباتی به حرکات روانتر رباتها و تصمیمگیری سریعتر منجر میشود؛ عاملی حیاتی برای استفاده در محیطهای واقعی که با محدودیت انرژی و تاخیر پردازشی مواجهاند.
رکوردهای جدید و عرضه متنباز
بر اساس نتایج اعلامشده RynnBrain در ۱۶ معیار متنباز حوزه embodied AI رکوردهای جدیدی ثبت کرده است. این آزمونها شامل ادراک محیط، استدلال فضایی و اجرای وظایف بوده و طبق ادعای علیبابا عملکرد این مدل از سیستمهایی مانند Gemini Robotics ER ۱.۵ گوگل و Cosmos Reason ۲ انویدیا بهتر بوده است.
همزمان با معرفی RynnBrain آکادمی DAMO هفت مدل متنباز دیگر شامل نسخههای پایه و نسخههای بهینهشده برای کاربردهای تجاری را نیز منتشر کرده تا موانع تحقیقاتی در حوزه رباتیک کاهش یابد. انتظار میرود این اقدام به تسریع توسعه در صنایع تولید، لجستیک و خدمات رباتیک کمک کند.
همچنین چارچوب ارزیابی جدیدی با نام RynnBrain-Bench معرفی شده که تمرکز آن بر وظایف دقیق فضازمانی است و شکاف موجود در روشهای ارزیابی سنتی مبتنی بر تصاویر ثابت را هدف قرار میدهد.
با حرکت رباتها از آزمایشگاهها به محیطهای واقعی مدلهایی مانند RynnBrain میتوانند نقش تعیینکنندهای در نحوه عملکرد ماشینها در جهان فیزیکی ایفا کنند؛ و به نظر میرسد علیبابا قصد دارد سهمی جدی در این رقابت جهانی داشته باشد.
انتهای پیام/


