رباتها بهترین دربازکنهای دنیا
ربات Unitree G۱ با سیستم تازه توسعهیافته انویدیا در اجرای وظایف باز کردن انواع درها عملکردی بهتر و سریعتر از اپراتورهای انسانی ثبت کرد.
به گزارش interesting engineering، پژوهشگران انویدیا از یک سامانه تازه یادگیری رباتیک با نام DoorMan رونمایی کردهاند؛ سیستمی که یک ربات انساننما را قادر میسازد درهای مختلف را سریعتر و مؤثرتر از اپراتورهای انسانی باز کند. این سامانه روی ربات Unitree G۱ به ارزش ۱۶ هزار دلار آزمایش شده و تنها با اتکا به دوربینهای RGB داخلی و یک سیاست یادگیری تقویتی آموزشدیده در شبیهسازی کار میکند. به گفته محققان این رویکرد موجب شده ربات بتواند در محیط واقعی، طیف گستردهای از درها را با سرعت و موفقیت بیشتری نسبت به انسانها باز کند.
بر اساس نتایج آزمایشهای میدانی DoorMan توانست تا ۳۱ درصد سریعتر از اپراتورهای انسانی وظیفه باز کردن در را انجام دهد و نرخ موفقیت بالاتری نیز به دست بیاورد. پژوهشگران این دستاورد را گامی مهم در پیشبرد حوزه لکو منیپولیشن میدانند؛ حوزهای که نیازمند هماهنگی همزمان راهرفتن، درک محیط، کنترل اندامها و انجام کارهای دقیق است.
آموزش کامل در شبیهسازی از پیکسل تا عمل
سامانه DoorMan از یک روش آموزشی جدید بهره میبرد که به طور کامل در محیط شبیهسازیشده Isaac Lab انویدیا انجام شده است. ربات هنگام کار فقط دادههای تصویری خام (RGB) را میبیند و برخلاف بسیاری از رباتهای انساننمای کنونی به حسگرهای عمق یا نشانگرهای حرکتی وابسته نیست؛ ابزارهایی که در شرایط واقعی اغلب دچار خطا میشوند.
برای مقابله با چالشهای رایج یادگیری تقویتی در وظایف فیزیکی، تیم تحقیق دو مشکل اصلی را هدف قرار داده است:
• چالش اکتشاف:
ربات معمولا در مراحل اولیه دائما شکست میخورد و ممکن است هرگز مسیر صحیح را پیدا نکند. برای حل این مشکل، پژوهشگران از مکانیزمی به نام بازتنظیم مرحلهای استفاده کردند؛ یعنی هرگاه ربات در شبیهسازی موفق به گرفتن دستگیره شد، آن وضعیت ذخیره شد و مراحل بعدی آموزش از همان نقطه آغاز گردید. این کار اجازه داد ربات بدون تکرار بیشازحد مراحل اولیه بخشهای پیچیدهتر باز کردن و عبور از در را تمرین کند.
• چالش خروج دستگیره از میدان دید:
هنگامی که ربات به در نزدیک میشود، احتمال دارد دستگیره از قاب دوربین خارج شود. برای رفع این مشکل از روش Group Relative Policy Optimization بهره گرفته شد؛ روشی که باعث میشود سیاست یادگرفتهشده طوری تنظیم شود که ویژگیهای مهم همیشه در دید باقی بمانند. در نتیجه ربات یاد گرفت در صورت لزوم کمی عقبتر بایستد یا زاویه سر خود را اصلاح کند.
رباتی که وارد جهانی پر از در شد
ربات انساننمای Unitree G۱ بهسرعت به پلتفرمی متداول در پژوهشهای رباتیک تبدیل شده و در پروژههای مختلفی از جمله در آمازون، دانشگاه کالیفرنیا سندیگو و دانشگاه پوردو استفاده میشود. این فراگیری باعث میشود مقایسه نتایج پژوهشها روی سختافزار یکسان آسانتر باشد.
در این پژوهش عملکرد DoorMan مستقیما با اپراتورهای انسانی که همین ربات را با سیستمهای واقعیت مجازی کنترل میکردند مقایسه شد. گزارش شده که انسانها اغلب قادر نبودند نیروهای لولا را بهدرستی از طریق ورودیهای VR تشخیص دهند و گاهی بیش از حد میکشیدند یا تعادل خود را از دست میدادند.
در مقابل سیستم خودکار طی آموزش در شبیهسازی با میلیونها در با ویژگیهای متفاوت روبهرو شد؛ از سختی و میرایی لولا گرفته تا ابعاد، شکل دستگیره و حتی بافت سطح. این دادههای گسترده به ربات سبک تعامل سازگارتر و متعادلتری بخشید.
نتایج نشان میدهد سامانه خودکار به ۸۳ درصد موفقیت دست یافت؛ در حالی که این رقم برای اپراتورهای خبره ۸۰ درصد و برای افراد غیرمتخصص ۶۰ درصد بود.
شبیهسازی بهجای دادههای انسانی
نویسندگان مطالعه اعلام کردهاند این پروژه نمونهای از یادگیری رباتیک مبتنی بر شبیهسازی است که بر مقیاسپذیری تکیه دارد نه دادههای نمایشی انسانها. به گفته آنها DoorMan نخستین سیاست کنترل انساننمایی است که تنها با تکیه بر دادههای RGB بهطور کامل در شبیهسازی آموزش دیده و بدون نیاز به تنظیمات اضافی فورا روی ربات واقعی اجرا شده است.
انتهای پیام/




