جستجو
برای جستجو متن مورد نظر وارد کنید و Enter بزنید برای بستن Esc بزنید.
پژوهشگران چینی از نرم افزار قدرتمند تولید ویدئو با هوش مصنوعی به نام Vidu رونمایی کردند. این نرم افزار با هوش مصنوعی قادر است با دریافت متن، ویدئوهای ۱۶ ثانیه ای با کیفیت ۱۰۸۰p تولید کند. رونمایی از این نرم افزار در انجمن ۲۰۲۴ Zhongguancun در پکن انجام شد و سازندگان آن Vidu را رقیبی جدی برای نرم افزار Sora شرکت OpenAI معرفی کردند.
قابلیت تولید ویدئوهای کوتاه تر: در حالی که نرم افزار Sora قادر به تولید ویدئوهای ۶۰ ثانیه ای است، Vidu ویدئوهای ۱۶ ثانیه ای تولید می کند. Vidu بر اساس معماری مبدل دیداری فراگیر (U-ViT) بنا شده است که به گفته شرکت سازنده به نرم افزار امکان شبیه سازی دنیای واقعی با تولید نماهای چند دوربینی را می دهد.
قابلیت های Vidu: به گفته شرکت سازنده، Vidu قادر به تولید ویدئوهایی با صحنه های پیچیده منطبق با قوانین فیزیک دنیای واقعی است، از جمله نورپردازی و سایه های واقع گرایانه و حالات چهره دقیق. این مدل همچنین با داشتن قوه تخیل قوی، محتوای سورئال و غیرموجود را با عمق و پیچیدگی ایجاد می کند. قابلیت های چند دوربینی Vidu امکان تولید نماهای پویا را فراهم می کند که به طور یکپارچه بین نماهای لانگ شات، کلوزآپ و مدیوم شات در یک صحنه جابجا می شود.
مقایسه با Sora: شرکت سازنده در نمایش خود سعی کرد صحنه های مشابهی را که قبلا توسط OpenAI هنگام عرضه Sora به اشتراک گذاشته شده بود، بازسازی کند. در حالی که Vidu دستاورد چشمگیری است و نشان دهنده پیشرفت سریع چین در تحقیقات هوش مصنوعی است، مقایسه مستقیم با Sora نشان می دهد که ویدئوهای تولید شده به سطح واقع گرایی Sora نمی رسند. خروجی Vidu در عین تأثیرگذاری، از نظر وفاداری بصری به پای Sora نمی رسد.
با این حال، مهم است که بپذیریم انسجام زمانی حاصل شده توسط Vidu قابل تحسین است و این فناوری پتانسیل بهبود و ارتقاء بیشتر در طول زمان را دارد.
دیدگاهتان را بنویسید!
برای نوشتن دیدگاه باید وارد بشوید.