به گزارش خبرنگار علم و فناوری خبرگزاری برنا، انویدیا اخیرا از یک مدل هوشمصنوعی جدید به نام Fugatto رونمایی کرد. این مدل از نوع Foundational Generative Audio Transformer Opus ۱ بوده و قادر است دستوراتی که به صورت متن وارد میشوند را برای تولید یا تغییر فایلهای صوتی، موسیقی، صدا و گفتار به کار بگیرد.
این مدل توسط تیمی از محققان هوشمصنوعی از سراسر جهان طراحی شده است و انویدیا اعلام کرده که قابلیتهای چند لهجهای و چند زبانه آن را تقویت کرده است.
رافائل ولی، یکی از محققان پشت این پروژه و مدیر تحقیقات کاربردی صدا در انویدیا گفت: ما میخواستیم مدلی بسازیم که صدا را همانطور که انسانها درک و تولید میکنند، بفهمد و ایجاد کند.
این مدل کاربردهای مختلفی در دنیای واقعی دارد که انویدیا در بیانیه خود به برخی از آنها اشاره کرده است. به عنوان مثال، تولیدکنندگان موسیقی میتوانند از این فناوری برای ایجاد سریع نمونههای اولیه از ایدههای موسیقی استفاده کنند و سپس آنها را به راحتی ویرایش کرده و سبکها، صداها و سازهای مختلف را آزمایش کنند. همچنین، افراد میتوانند از این مدل برای ایجاد محتوای آموزشی زبان با صدای دلخواه خود استفاده کنند. توسعهدهندگان بازیهای ویدئویی نیز میتوانند از آن برای ایجاد و تغییر نسخههای مختلف از فایلهای صوتی پیشساخته به منظور تطبیق با انتخابها و اقدامهای بازیکنان در بازیها استفاده کنند.
از دیگر ویژگیهای جالب این مدل، توانایی آن در انجام کارهایی است که در فرآیند آموزش اولیه آن قرار نداشته است. به عنوان مثال، مدل قادر است با کمی تنظیم مجدد، دستوراتی مانند تولید گفتار خشمگین با لهجه خاص یا صدای پرندگان در حال آواز خواندن در طول یک طوفان رعد و برق را ایجاد کند. Fugatto همچنین توانایی تولید صداهایی دارد که در طول زمان تغییر میکنند، مانند صدای باران که با حرکت خود بر روی زمین تغییر میکند.
انویدیا در حال حاضر اشارهای نکرده است که آیا این مدل را در دسترس عموم قرار خواهد داد یا خیر. با این حال، Fugatto نخستین فناوری هوشمصنوعی برای تولید صدا از طریق دستورات متنی نیست.
پیش از این، متا یک کیت هوشمصنوعی متنباز منتشر کرده بود که میتواند صداهایی را از توصیفات متنی تولید کند و گوگل نیز دارای فناوری هوشمصنوعی خاص خود به نام MusicLM است که کاربران میتوانند از طریق وبسایت آزمایشی "AI Test Kitchen" به آن دسترسی پیدا کنند.
انتهای پیام/