کلینگ جدیترین مدل ویدیویی هوش مصنوعی
به گزارش خبرنگار گروه علم و فناوری خبرگزاری برنا؛ یک مدل جدید ویدئویی هوش مصنوعی به نام Kling بسیاری از ویژگیهای مشابهی را ارائه میدهد که باعث شد Openais Sora در اوایل سال جاری که برای اولین بار اعلام شد، برجسته شود.
کلینگ ساخته شده توسط شرکت پلت فرم ویدئویی چینی Kuaishou است که ویژگیهای آن شامل نسلهای ویدئویی طولانیتر، حرکت بهبود یافته، دنبالههای سریع بهتر و چند عکس میباشد. برخلاف سورا، به نظر میرسد که کلینگ از طریق لیست انتظار در دسترس کاربران قرار گرفته است.
از کلیپهای آن میتوان به یک کلیپ طولانی از یک پسر روی دوچرخه، یک اسب در بیابان، کسی که نودل میخورد و یک ویدیوی فوتورئالیستی از یک پسر جوان که از یک همبرگر لذت میبرد، اشاره کرد.

از کلینگ چه میدانیم؟
به گفته کویشو، کلینگ میتواند تا دو دقیقه ویدیو را از یک پیام در ۱۰۸۰p با ۳۰ فریم در ثانیه تولید کند. همچنین به طور دقیق فیزیک دنیای واقعی را شبیه سازی میکند که چیزی است که اکثر مدلهای هوش مصنوعی با آن مبارزه میکنند.
این یک مدل ترانسفورماتور پخش همان Sora است و از یک مدل اختصاصی استفاده میکند که میتواند طیف وسیعی از نسبتهای ابعاد و انواع شات را پشتیبانی کند.
علاوه بر ویژگیهای تولید کننده، Kling قادر به بازسازی پیشرفته ۳D صورت و بدن برای بهبود بیان کامل و حرکت اندام در داخل ویدیو است، این شرکت در وب سایت خود توضیح داد.
چیزی که ما هنوز نمیدانیم این است که آیا کینگ، یا حتی دیگر مدل بزرگ ویدیویی هوش مصنوعی چینی Vida هرگز در خارج از چین منتشر خواهد شد. این مدل میتواند نجات دهندهی اوپنای در غرب باشد.

ویدئوهای کلینگ چه شکلی هستند؟
قابل توجهترین آن بخش فیلمها فوتورئالیسم است. در برخی از کلیپها آنها از تار شدن مشابهی رنج میبرند که در سایر فیلمهای هوش مصنوعی میبینیم، اما نه در همان مقیاس. به نظر میرسد که کلینگ توانایی ایجاد حرکت دقیق، مدل بهتر حرکت و فیزیک در دنیای واقعی و ایجاد یک تصویر فوتورئالیستی از جهان را دارد.
OpenAI همچنین با رقابت بازیکنان موجود مانند Runway و PikaLabs مواجه است که هر دو بازی خود را افزایش میدهند. همچنین تازه واردانی مانند Haiper، Ltx Studio و Higgsfield وجود دارند که هر کدام رویکردهای مختلفی را برای ویدیوی هوش مصنوعی اتخاذ میکنند و گوگل مدل جدید Veo خود را دارد.
واقعیت این است که تاخیر OpenAI یکی از دسترسی فنی نیست بلکه ایمنی است. این شرکت میگوید که میخواهد اطمینان حاصل کند که این مدل نمیتواند برای اطلاعات نادرست یا اهداف مخرب قبل از ارائه آن به عموم مردم استفاده شود. آنها همچنین باید آن را سریعتر و ارزانتر کنند.

انتهای پیام/




