به گزارش خبرنگار علم و فناوری خبرگزاری برنا؛ سورا، میتواند ویدئوهایی با وضوح حداکثر 1080p تولید کند، این هوشمصنوعی توانایی ویرایش تصویر و ویدئو را دارد، از ایجاد ویدئوهای لوپ و جلوبردن و عقبکشیدن زمان ویدیو تا تغییر پسزمینهی ویدئویی که خود کاربر آن را از قبل فیلمبرداری کرده است.
جالبترین قابلیت سورا، در شبیهسازی جهانهای دیجیتالی است، در یک آزمایش، OpenAI به سورا دستوراتی حاوی کلمهی Minecraft داد و از آن خواست تا یک HUD و بازیِ متقاعدکننده مانند Minecraft بسازد و فیزیک مشابه آن را ارائه دهد و همزمان شخصیت بازیکن را کنترل کند.
براساس مشاهدات جیم فان، محقق ارشد انویدیا، سورا بیشتر از اینکه هوش مصنوعی مولد باشد، یک موتور فیزیکی دادهمحور است. سورا تنها عکس یا ویدئو تولید نمیکند، بلکه فیزیک هر شیء را در یک محیط تعیین و یک عکس یا ویدئو (یا یک جهان سهبعدیِ تعاملی) را براساس دستورها کاربر رندر میکند.
محققان OpenAI مینویسند: «این قابلیتها نشان میدهد که مقیاسپذیریِ مداومِ مدلهای ویدئویی، مسیر امیدوارکنندهای به سمت توسعهی شبیهسازهای بسیار توانمند دنیاهای فیزیکی و دیجیتالی است که در آن اشیاء، حیوانات و کاربران میتوانند زندگی کنند.»
محدودیتهای معمول سورا در حوزهی بازیهای ویدیویی خلاصه میشود. این مدل نمیتواند بهطور دقیق فیزیک برهمکنشهای پایه مانند خرد شدن شیشه را تخمین بزند. سورا حتی تعاملات را اغلب بهطور متناقض نمایش میدهد؛ برای مثال فردی را در حال خوردن برگر مدلسازی کرده است اما نمیتواند محل گاز گرفتن روی برگر را رندر کند.
به نظر میرسد که سورا میتواند راه را برای بازیهای واقع گرایانهتر و شاید حتی فوتورئالیستی از توصیفات متنی کاربران هموار کند. این همان بخش هیجانانگیز و ترسناک هوش مصنوعی است و احتمالا به همین دلیل است که OpenAI تصمیم گرفته تا دسترسی به سورا را بسیار محدود نگه دارد.
انتهای پیام/