هوش مصنوعی جدید بایت دنس در خدمت فیلمسازان
شرکت بایتدنس مدل جدید Seedance ۲.۰ را عرضه کرد. ای مدل برای تولید ویدئو با هوش مصنوعی که روایتهای چندصحنهای با صدا همگام ایجاد میکند. این سیستم ویدئوهای ۲K را حدود ۳۰ درصد سریعتر از مدلهای رقیب مانند Kling تولید میکند و نیاز به ویرایش دستی را کاهش میدهد (بر اساس گزارش CNBC TV۱۸).
به گزارش تک کرانچ، ویژگی اصلی Seedance ۲.۰، قابلیت روایت چندلنزی (multi-lens storytelling) است که چند صحنه مرتبط با یکدیگر را ایجاد میکند و ثبات کاراکترها و سبک بصری را حفظ میکند. این روش میزان ویرایش دستی که معمولاً برای اتصال کلیپهای تولید شده توسط هوش مصنوعی لازم است را کاهش میدهد.
مدل از هشت زبان از جمله انگلیسی و روسی پشتیبانی میکند و میتواند متن، تصویر، ویدئو کوتاه یا صوت را بهعنوان ورودی دریافت کند.
این شبکه عصبی فعلا از طریق نسخه چینی سرویس Dreamina بایتدنس در دسترس است و با حسابهای Douyin قابل استفاده است. تا پایان فوریه، Seedance ۲.۰ به پلتفرمهای ثالث از جمله CapCut، Higgsfield و Imagine.Art نیز گسترش خواهد یافت (طبق گزارش ForkLog).
کاربران اولیه از انتقال بسیار طبیعی و تقریبا حرفهای بین صحنهها گزارش دادهاند. یکی از کاربران با نام el.cine ویژگیها را «تقریباً غیرقانونی» توصیف کرده و اشاره کرده که سیستم صحنههای کامل با جلوههای بصری، صدا، صداپیشگی و موسیقی از متنهای بارگذاری شده تولید میکند.
این معرفی باعث واکنش سریع بازار شد: سهام COL Group به حد ۲۰ درصد محدودیت روزانه رسید و Shanghai Film و Perfect World هرکدام ۱۰٪ افزایش داشتند. تحلیلگران Kaiyuan Securities محصول را یک «لحظه تکینگی» برای هوش مصنوعی در تولید محتوای تصویری نامیدند.
این هوش مصنوعی از ساختار dual-branch diffusion transformer استفاده میکند که همزمان ویدئو و صدا تولید میکند و دیگر مشکلات همگامسازی صوت و تصویر که در سیستمهای پیشین رایج بود را ندارد.
نسخه بتای محدود این مدل هماکنون در دسترس کاربران منتخب Jimeng AI، پلتفرم ویدئویی هوش مصنوعی بایتدنس، قرار دارد و برنامههای شرکت برای دسترسی گستردهتر با هدف رقابت در بازار پرشتاب تولید ویدئوی هوش مصنوعی چین اعلام شده است.
انتهای پیام/


