آژانس مدیا و مارکتینگ ردی استودیو
#

گوگل ابزار قدرتمند تولید تصویر AI خود به نام Imagen 3 را در Gemini ارائه کرد - آژانس مدیا و مارکتینگ ردی استودیو

گوگل ابزار قدرتمند تولید تصویر AI خود به نام Imagen 3 را در Gemini ارائه کرد

گوگل ابزار قدرتمند تولید تصویر AI خود به نام Imagen 3 را در Gemini ارائه کرد

گوگل، Imagen 3 — هوش مصنوعی قدرتممند مولد تصویر این شرکت — را به Gemini، چت‌بات هوش مصنوعی خود آورده است. این یعنی کاربران می‌توانند تصاویر را از طریق این دستیار هوش مصنوعی به روشی مشابه با DALL-E در ChatGPT تولید کنند. اما یک محدودیت وجود دارد: کاربران نمی‌توانند تصاویر افراد را تولید کنند.

تولید تصاویر افراد فقط در دسترسی اولیه Gemini Advanced ممکن است. گوگل یک دوره آزمایشی رایگان یک ماهه از Gemini Advanced ارائه می‌دهد و پس از آن هزینه‌ای معادل ۱۹.۹۹ دلار در ماه دارد.

Imagen 3 قبلاً فقط برای سرویس AI Test Kitchen گوگل در دسترس بود، اما انتقال آن به Gemini به معنی آن است که تعداد بیشتری از مردم می‌توانند از این مدل استفاده کنند.

Imagen 3Imagen 3
گوگل ابزار قدرتمند تولید تصویر AI خود به نام Imagen 3 را در Gemini ارائه کرد 1

گوگل می‌گوید: «Imagen 3 با کیفیت‌ترین مدل متن به تصویر ما است که قادر است تصاویر را با جزئیات بهتر، نورپردازی غنی‌تر و تعداد کمتری از ایرادات حواس‌پرت‌کننده نسبت به مدل‌های قبلی ما تولید کند.»

«ما به طور قابل توجهی توانایی Imagen 3 را در فهم درخواست‌ها بهبود داده‌ایم که این به مدل‌ها کمک می‌کند تا طیف گسترده‌ای از سبک‌های بصری را تولید کرده و جزئیات کوچک درخواست‌های طولانی‌تر را به تصویر بکشند.»

بیشتر بخوانید: گوگل هوش مصنوعی تصویرساز قدرتمند خود را به صورت رایگان عرضه کرد

اطلاعات کمی درباره داده‌هایی که برای آموزش Imagen 3 استفاده شده، منتشر شده است. در مقاله‌ای، گوگل می‌گوید: «مدل Imagen 3 بر روی یک مجموعه داده بزرگ شامل تصاویر، متن و توضیحات مرتبط آموزش داده شده است.» به احتمال زیاد این مجموعه شامل تعداد زیادی عکس دارای حق‌کپی است.

1731302537 چرا شهرهای بزرگ ایران هنوز هویت بصری مشخصی ندارند؟ - آژانس مدیا و مارکتینگ ردی استودیو بیشتر بخوانید: چرا شهرهای بزرگ ایران هنوز هویت بصری مشخصی ندارند؟

علاوه بر تولید تصاویر، گوگل گزینه ویرایش تصاویر با استفاده از تکنیک مرسوم inpainting را نیز ارائه می‌دهد. این روش به کاربر امکان می‌دهد بخشی از تصویر را انتخاب کرده و تغییرات دلخواه خود را وارد کند.

Imagen 3Imagen 3
گوگل ابزار قدرتمند تولید تصویر AI خود به نام Imagen 3 را در Gemini ارائه کرد 2

برخلاف مولد تصویر هوش مصنوعی Grok متعلق به ایلان ماسک، گوگل محدودیت‌هایی برای Imagen 3 قرار داده است.

با این حال، همانطور که به خوبی مستند شده، روش‌هایی برای دور زدن این محدودیت‌ها وجود دارد. برای مثال، با درخواست از Imagen 3 برای “ساخت یک عکس سیاه و سفید دراماتیک گرفته شده در سال ۱۹۴۲ از پارک ملی Grand Teton در وایومینگ”، کاربر تصویری مشابه آثار انسل آدامز دریافت خواهد کرد.

اوایل امسال، گوگل پس از آنکه مولد تصویر هوش مصنوعی‌اش در Gemini به دلیل تصحیح بیش از حد تعصبات و در واقع “پاک کردن سفیدپوستان” مورد اتهام قرار گرفت، مجبور شد این مولد را به طور کامل حذف کند.

برای امتحان Imagen 3 در Gemini، به Gemini مراجعه کنید.

منبع

مقالات مرتبط

چرا شهرهای بزرگ ایران هنوز هویت بصری مشخصی ندارند؟

چرا شهرهای بزرگ ایران هنوز هویت بصری مشخصی ندارند؟

هویت بصری یک شهر به‌مثابه امضای آن شهر است. وقتی به شهرهایی همچون پاریس، نیویورک، توکیو، استانبول یا حتی بارسلونا فکر می‌کنیم، ترکیبی از عناصر بصری به ذهنمان می‌آید: برج ایفل، تابلوهای نئون شینجوکو، مناره‌های سنت صوفیا و نمای منحنی و رنگی گائودی. این نمادها...

پوستر سی‌ودومین دوره هفته کتاب منتشر شد

پوستر سی‌ودومین دوره هفته کتاب منتشر شد

گوگل ابزار قدرتمند تولید تصویر AI خود به نام Imagen 3 را در Gemini ارائه کرد 5 پوستر سی‌ودومین دوره هفته کتاب جمهوری اسلامی ایران با شعار «خواندن برای همدلی» منتشر شد، اما در اطلاع‌رسانی رسمی نامی از طراح این پوستر برده نشده است. این...

چگونه مثل یک عکاس ببینیم

چگونه مثل یک عکاس ببینیم

چشم انسان به عنوان یکی از پیچیده‌ترین و توانمندترین «اختراعات» جهان شناخته می‌شود. چشم‌ها به ما قدرتی فوق‌العاده می‌دهند تا دنیای اطرافمان را ببینیم و در عکاسی، از آنچه می‌بینیم لذت ببریم. دید ما محدودیت‌های کمتری نسبت به دوربین و لنزهایمان دارد. این تفاوت به...

دیدگاهتان را بنویسید

آخرین مقالات

چرا شهرهای بزرگ ایران هنوز هویت بصری مشخصی ندارند؟

چرا شهرهای بزرگ ایران هنوز هویت بصری مشخصی ندارند؟

هویت بصری یک شهر به‌مثابه امضای آن شهر است. وقتی به شهرهایی همچون پاریس، نیویورک، توکیو، استانبول یا حتی بارسلونا فکر می‌کنیم، ترکیبی از عناصر بصری به ذهنمان می‌آید: برج ایفل، تابلوهای نئون شینجوکو، مناره‌های سنت صوفیا و نمای منحنی و رنگی گائودی. این نمادها...

تراشه‌های موبایل پرچم‌دار ۲۰۲۴ در برابر هم [تماشا کنید]

تراشه‌های موبایل پرچم‌دار ۲۰۲۴ در برابر هم [تماشا کنید]

سال ۲۰۲۴ رو به پایان است و شاهد بودیم که شرکت‌های کوالکام، اپل، مدیاتک و سامسونگ تمام تلاششان را کردند تا به نوبه‌ی خود بهترین تراشه‌ی موبایلی حال حاضر دنیا را معرفی کنند. اسنپدراگون ۸ الیت و A18 Pro اپل را می‌توان جدی‌ترین رقبای یکدیگر...

سیاه‌چاله‌ها می‌توانند عامل انبساط جهان باشند

سیاه‌چاله‌ها می‌توانند عامل انبساط جهان باشند

ستاره‌شناس‌ها احتمالا به شواهدی هیجان‌انگیز دست یافته‌اند که نشان می‌دهد انرژی تاریک، نیروی اسرارآمیزی که عامل افزایش سرعت انبساط جهان ما است، می‌تواند به سیاه‌چاله‌ها ربط داشته باشد. انرژی تاریک نزدیک به ۷۰ درصد از جهان ما را تشکیل می‌دهد و تصور می‌شود که پس...

نظرسنجی: رفع فیلتر کدام پلتفرم برای شما اولویت دارد؟

نظرسنجی: رفع فیلتر کدام پلتفرم برای شما اولویت دارد؟

این روزها دولت از عزم جدی خود برای برداشتن فیلترینگ می‌گوید و در اظهارنظرهای مختلف از مسئولان هم مخالفت با فیلترینگ و تاکید بر شکست‌خورده و بی‌نتیجه بودن آن شنیده می‌شود. اخبار شنیده‌شده از گوشه و کنار هم از نزدیک بودن روزهای رفع فیلتر حکایت...