گوگل ابزار قدرتمند تولید تصویر AI خود به نام Imagen 3 را در Gemini ارائه کرد - آژانس مدیا و مارکتینگ ردی استودیو
گوگل ابزار قدرتمند تولید تصویر AI خود به نام Imagen 3 را در Gemini ارائه کرد
گوگل، Imagen 3 — هوش مصنوعی قدرتممند مولد تصویر این شرکت — را به Gemini، چتبات هوش مصنوعی خود آورده است. این یعنی کاربران میتوانند تصاویر را از طریق این دستیار هوش مصنوعی به روشی مشابه با DALL-E در ChatGPT تولید کنند. اما یک محدودیت وجود دارد: کاربران نمیتوانند تصاویر افراد را تولید کنند.
تولید تصاویر افراد فقط در دسترسی اولیه Gemini Advanced ممکن است. گوگل یک دوره آزمایشی رایگان یک ماهه از Gemini Advanced ارائه میدهد و پس از آن هزینهای معادل ۱۹.۹۹ دلار در ماه دارد.
Imagen 3 قبلاً فقط برای سرویس AI Test Kitchen گوگل در دسترس بود، اما انتقال آن به Gemini به معنی آن است که تعداد بیشتری از مردم میتوانند از این مدل استفاده کنند.
گوگل میگوید: «Imagen 3 با کیفیتترین مدل متن به تصویر ما است که قادر است تصاویر را با جزئیات بهتر، نورپردازی غنیتر و تعداد کمتری از ایرادات حواسپرتکننده نسبت به مدلهای قبلی ما تولید کند.»
«ما به طور قابل توجهی توانایی Imagen 3 را در فهم درخواستها بهبود دادهایم که این به مدلها کمک میکند تا طیف گستردهای از سبکهای بصری را تولید کرده و جزئیات کوچک درخواستهای طولانیتر را به تصویر بکشند.»
بیشتر بخوانید: گوگل هوش مصنوعی تصویرساز قدرتمند خود را به صورت رایگان عرضه کرد
اطلاعات کمی درباره دادههایی که برای آموزش Imagen 3 استفاده شده، منتشر شده است. در مقالهای، گوگل میگوید: «مدل Imagen 3 بر روی یک مجموعه داده بزرگ شامل تصاویر، متن و توضیحات مرتبط آموزش داده شده است.» به احتمال زیاد این مجموعه شامل تعداد زیادی عکس دارای حقکپی است.
بیشتر بخوانید: چرا شهرهای بزرگ ایران هنوز هویت بصری مشخصی ندارند؟
علاوه بر تولید تصاویر، گوگل گزینه ویرایش تصاویر با استفاده از تکنیک مرسوم inpainting را نیز ارائه میدهد. این روش به کاربر امکان میدهد بخشی از تصویر را انتخاب کرده و تغییرات دلخواه خود را وارد کند.
برخلاف مولد تصویر هوش مصنوعی Grok متعلق به ایلان ماسک، گوگل محدودیتهایی برای Imagen 3 قرار داده است.
با این حال، همانطور که به خوبی مستند شده، روشهایی برای دور زدن این محدودیتها وجود دارد. برای مثال، با درخواست از Imagen 3 برای “ساخت یک عکس سیاه و سفید دراماتیک گرفته شده در سال ۱۹۴۲ از پارک ملی Grand Teton در وایومینگ”، کاربر تصویری مشابه آثار انسل آدامز دریافت خواهد کرد.
اوایل امسال، گوگل پس از آنکه مولد تصویر هوش مصنوعیاش در Gemini به دلیل تصحیح بیش از حد تعصبات و در واقع “پاک کردن سفیدپوستان” مورد اتهام قرار گرفت، مجبور شد این مولد را به طور کامل حذف کند.
برای امتحان Imagen 3 در Gemini، به Gemini مراجعه کنید.
مقالات مرتبط
آخرین مقالات
چرا شهرهای بزرگ ایران هنوز هویت بصری مشخصی ندارند؟
هویت بصری یک شهر بهمثابه امضای آن شهر است. وقتی به شهرهایی همچون پاریس، نیویورک، توکیو، استانبول یا حتی بارسلونا فکر میکنیم، ترکیبی از عناصر بصری به ذهنمان میآید: برج ایفل، تابلوهای نئون شینجوکو، منارههای سنت صوفیا و نمای منحنی و رنگی گائودی. این نمادها...
تراشههای موبایل پرچمدار ۲۰۲۴ در برابر هم [تماشا کنید]
سال ۲۰۲۴ رو به پایان است و شاهد بودیم که شرکتهای کوالکام، اپل، مدیاتک و سامسونگ تمام تلاششان را کردند تا به نوبهی خود بهترین تراشهی موبایلی حال حاضر دنیا را معرفی کنند. اسنپدراگون ۸ الیت و A18 Pro اپل را میتوان جدیترین رقبای یکدیگر...
سیاهچالهها میتوانند عامل انبساط جهان باشند
ستارهشناسها احتمالا به شواهدی هیجانانگیز دست یافتهاند که نشان میدهد انرژی تاریک، نیروی اسرارآمیزی که عامل افزایش سرعت انبساط جهان ما است، میتواند به سیاهچالهها ربط داشته باشد. انرژی تاریک نزدیک به ۷۰ درصد از جهان ما را تشکیل میدهد و تصور میشود که پس...
نظرسنجی: رفع فیلتر کدام پلتفرم برای شما اولویت دارد؟
این روزها دولت از عزم جدی خود برای برداشتن فیلترینگ میگوید و در اظهارنظرهای مختلف از مسئولان هم مخالفت با فیلترینگ و تاکید بر شکستخورده و بینتیجه بودن آن شنیده میشود. اخبار شنیدهشده از گوشه و کنار هم از نزدیک بودن روزهای رفع فیلتر حکایت...