Veo و Imagen 3 رونمایی شدند؛ ابزارهای خاص هوش مصنوعی گوگل برای تولید ویدیو و عکس
گوگل در جریان رویداد توسعهدهندگان خود از مدلهای مختلف هوش مصنوعی رونمایی کرد. در همین رابطه میتوان به مدل Imagen 3 برای تبدیل متن به تصویر و مدل هوش مصنوعی Veo برای تبدیل متن به ویدیوهای 1080p اشاره کرد. در ادامه این نوشتار جزئیات بیشتری را درباره این مدلهای هوش مصنوعی بخوانید.
گوگل برای عقب نماندن از Open AI و مدلهای Sora و Dall-E 3 این شرکت، از مدل هوش مصنوعی Veo و Imagen 3 خودش رونمایی کرد. Imagen 3 را میتوان نسخه بهبودیافته پلتفرم تبدیل متن به تصویر گوگل دانست.
همچنین مدل Veo را داریم که با دریافت متن، ویدیوهای 1080p میسازد. مدلی که گوگل درباره آن مدعی شده که درک پیشرفتهای از زبان طبیعی و مفاهیم تصویری دارد و میتوان هر ویدیویی که بخواهید را برایتان بسازد!
تولید محتوای طولانی با مدلهای هوش مصنوعی گوگل
ویدیوهای ساخته شده با Veo بیش از یک دقیقه خواهند بود و میتوان از تکنیکهای سینمایی مثل تایم لپس نیز در آن استفاده کرد. همچنین گوگل در ساخت Veo به قوانین فیزیک توجه بیشتری داشته تا ویدیوهای باکیفیتی را تحویل کاربران دهد.
هوش مصنوعی ویدیوساز Veo از امروز در بخش VideoFX گوگل برای برخی از سازندگان در دسترس خواهد بود و این شرکت میگوید که به YouTube Shorts و سایر محصولات نیز میآید.
علاوه بر این گوگل از مدل هوش مصنوعی Imagen 3 رونمایی کرده که با کیفیتترین مدل این شرکت محسوب میشود. مدل Imagen 3 بهتر از قبل متن را درک میکند و و میتواند جزییات بیشتری از پرامپتهای طولانی استخراج و در تصاویر به کار ببرد.
گوگل این مولد تصویر هوش مصنوعی را بهزودی در دسترس توسعهدهندگان و مشتریان سازمانی قرار خواهد داد. ظاهراً این شرکت در نظر دارد که در فاز بعدی، هوش مصنوعی Imagen 3 را برای عموم افراد نیز منتشر کند.
گوگل در کنار این دو مدل از ابزار جدیدی بهنام Music AI Sandbox برای تولید آهنگ به کمک هوش مصنوعی رونمایی کرد. گوگل گفته که این ابزار بهکمک آهنگسازها و ترانهسراها توسعه یافته است.
منبع: شهر سخت افزار