صفحه نخست

فیلم

عکس

ورزشی

اجتماعی

باشگاه جوانی

سیاسی

فرهنگ و هنر

اقتصادی

علمی و فناوری

بین الملل

استان ها

رسانه ها

بازار

صفحات داخلی

«سورا» هوش‌‎‌مصنوعی که به صورت آنی از یک خط متن ویدئو می‌سازد

۱۴۰۲/۱۱/۲۸ - ۱۴:۱۴:۰۱
کد خبر: ۲۰۵۹۸۷۸
OpenAI ابزار هوش‌مصنوعی جدیدی را به اشتراک گذاشته است که به صورت آنی تنها از یک خط متن ویدئو تولید می‌کند.

به گزارش خبرنگار علم و فناوری خبرگزاری برنا؛ سورا، می‌تواند ویدئوهایی با وضوح حداکثر 1080p تولید کند، این هوش‌مصنوعی توانایی ویرایش تصویر و ویدئو را دارد، از ایجاد ویدئوهای لوپ و جلوبردن و عقب‌کشیدن زمان ویدیو تا تغییر پس‌زمینه‌ی ویدئویی که خود کاربر آن را از قبل فیلم‌برداری کرده است.

جالب‌ترین قابلیت سورا، در شبیه‌سازی جهان‌های دیجیتالی است، در یک آزمایش، OpenAI به سورا دستوراتی حاوی کلمه‌ی Minecraft داد و از آن خواست تا یک HUD و بازیِ متقاعدکننده مانند Minecraft بسازد و فیزیک مشابه آن را ارائه دهد و هم‌زمان شخصیت بازیکن را کنترل کند.

براساس مشاهدات جیم فان، محقق ارشد انویدیا، سورا بیشتر از این‌که هوش مصنوعی مولد باشد، یک موتور فیزیکی داده‌محور است. سورا تنها عکس یا ویدئو تولید نمی‌کند، بلکه فیزیک هر شیء را در یک محیط تعیین و یک عکس یا ویدئو (یا یک جهان سه‌بعدیِ تعاملی) را براساس دستورها کاربر رندر می‌کند.

محققان OpenAI می‌نویسند: «این قابلیت‌ها نشان می‌دهد که مقیاس‌پذیریِ مداومِ مدل‌های ویدئویی، مسیر امیدوارکننده‌ای به سمت توسعه‌ی شبیه‌سازهای بسیار توانمند دنیاهای فیزیکی و دیجیتالی است که در آن اشیاء، حیوانات و کاربران می‌توانند زندگی کنند.»

محدودیت‌های معمول سورا در حوزه‌ی بازی‌های ویدیویی خلاصه می‌شود. این مدل نمی‌تواند به‌طور دقیق فیزیک برهمکنش‌های پایه مانند خرد شدن شیشه را تخمین بزند. سورا حتی تعاملات را اغلب به‌طور متناقض نمایش می‌دهد؛ برای مثال فردی را در حال خوردن برگر مدل‌سازی کرده است اما نمی‌تواند محل گاز گرفتن روی برگر را رندر کند.

به نظر می‌رسد که سورا می‌تواند راه را برای بازی‌های واقع گرایانه‌تر و شاید حتی فوتورئالیستی از توصیفات متنی کاربران هموار کند. این همان بخش‌ هیجان‌انگیز و ترسناک هوش مصنوعی است و احتمالا به همین دلیل است که OpenAI تصمیم گرفته تا دسترسی به سورا را بسیار محدود نگه دارد.

انتهای پیام/

نظر شما