ورود و ثبت نام
ورود و ثبت نام

خواندن این مطلب 2 دقیقه زمان میبرد!

گوگل، Imagen 3 — هوش مصنوعی قدرتممند مولد تصویر این شرکت — را به Gemini، چت‌بات هوش مصنوعی خود آورده است. این یعنی کاربران می‌توانند تصاویر را از طریق این دستیار هوش مصنوعی به روشی مشابه با DALL-E در ChatGPT تولید کنند. اما یک محدودیت وجود دارد: کاربران نمی‌توانند تصاویر افراد را تولید کنند.

تولید تصاویر افراد فقط در دسترسی اولیه Gemini Advanced ممکن است. گوگل یک دوره آزمایشی رایگان یک ماهه از Gemini Advanced ارائه می‌دهد و پس از آن هزینه‌ای معادل ۱۹.۹۹ دلار در ماه دارد.

Imagen 3 قبلاً فقط برای سرویس AI Test Kitchen گوگل در دسترس بود، اما انتقال آن به Gemini به معنی آن است که تعداد بیشتری از مردم می‌توانند از این مدل استفاده کنند.

Imagen 3Imagen 3
گوگل ابزار قدرتمند تولید تصویر AI خود به نام Imagen 3 را در Gemini ارائه کرد 1

گوگل می‌گوید: «Imagen 3 با کیفیت‌ترین مدل متن به تصویر ما است که قادر است تصاویر را با جزئیات بهتر، نورپردازی غنی‌تر و تعداد کمتری از ایرادات حواس‌پرت‌کننده نسبت به مدل‌های قبلی ما تولید کند.»

«ما به طور قابل توجهی توانایی Imagen 3 را در فهم درخواست‌ها بهبود داده‌ایم که این به مدل‌ها کمک می‌کند تا طیف گسترده‌ای از سبک‌های بصری را تولید کرده و جزئیات کوچک درخواست‌های طولانی‌تر را به تصویر بکشند.»

بیشتر بخوانید: گوگل هوش مصنوعی تصویرساز قدرتمند خود را به صورت رایگان عرضه کرد

اطلاعات کمی درباره داده‌هایی که برای آموزش Imagen 3 استفاده شده، منتشر شده است. در مقاله‌ای، گوگل می‌گوید: «مدل Imagen 3 بر روی یک مجموعه داده بزرگ شامل تصاویر، متن و توضیحات مرتبط آموزش داده شده است.» به احتمال زیاد این مجموعه شامل تعداد زیادی عکس دارای حق‌کپی است.

عکاسی مادون قرمز، زن پنهان در نقاشی پیکاسو را فاش کرد
بیشتر بخوانید: عکاسی مادون قرمز، زن پنهان در نقاشی پیکاسو را فاش کرد

علاوه بر تولید تصاویر، گوگل گزینه ویرایش تصاویر با استفاده از تکنیک مرسوم inpainting را نیز ارائه می‌دهد. این روش به کاربر امکان می‌دهد بخشی از تصویر را انتخاب کرده و تغییرات دلخواه خود را وارد کند.

Imagen 3Imagen 3
گوگل ابزار قدرتمند تولید تصویر AI خود به نام Imagen 3 را در Gemini ارائه کرد 2

برخلاف مولد تصویر هوش مصنوعی Grok متعلق به ایلان ماسک، گوگل محدودیت‌هایی برای Imagen 3 قرار داده است.

با این حال، همانطور که به خوبی مستند شده، روش‌هایی برای دور زدن این محدودیت‌ها وجود دارد. برای مثال، با درخواست از Imagen 3 برای “ساخت یک عکس سیاه و سفید دراماتیک گرفته شده در سال ۱۹۴۲ از پارک ملی Grand Teton در وایومینگ”، کاربر تصویری مشابه آثار انسل آدامز دریافت خواهد کرد.

اوایل امسال، گوگل پس از آنکه مولد تصویر هوش مصنوعی‌اش در Gemini به دلیل تصحیح بیش از حد تعصبات و در واقع “پاک کردن سفیدپوستان” مورد اتهام قرار گرفت، مجبور شد این مولد را به طور کامل حذف کند.

برای امتحان Imagen 3 در Gemini، به Gemini مراجعه کنید.

منبع

دسته بندی مطالب

محصولات جدید

61%
دامنه ehsan-teb.ir
تومان
850,000
2,200,000
ارائه خدمات ثبت دامنه
تومان
215,000
55%
دامنه Vrasty.ir
تومان
4,500,000
10,000,000
50%
دامنه ReadyMusic.ir
تومان
2,500,000
5,000,000
30%
دامنه RahePayam.ir
تومان
3,500,000
5,000,000
76%
دامنه KetabSetan.ir
تومان
1,200,000
5,000,000

جستجو کنید ...

تبلیغات

نظرات کاربـــران
فاقد دیدگاه
دیدگاهی برای این مطلب ثبت نشده است. اولین دیدگاه را شما بنویسید.
ثبت دیدگاه
مطالب مرتبـــط