این هفته، یک ژنراتور ناشناخته با نام «پاندای سرخ» همه مدلهای برتر هوش مصنوعی تبدیل متن به تصویر را پشت سر گذاشته و در صدر جدول رتبهبندی Text-to-Image Model قرار گرفته است. این موضوع توجه جامعه طراحی و تکنولوژی را به خود جلب کرده است. اما پاندای سرخ چیست، چه کسی پشت این مدل است، و چگونه میتوان به این تکنولوژی دسترسی پیدا کرد؟
روز چهارشنبه، شرکت مستقر در لندن، Recraft، اعلام کرد که مدل جدیدش به نام Recraft V3 پشت موفقیتهای اخیر پروژهای با کد «پاندای سرخ» بوده است. این مدل توانست با کسب امتیاز ELO قابلتوجه ۱۱۷۲ از مدلهای شناختهشدهای مانند Midjourney، Stable Diffusion، و DALL-E 3 جلو بزند.
Recraft، که توسط آنا ورونیکا دوروگوش، سازنده فریمورک یادگیری ماشین CatBoost، تأسیس شده است، تمرکز ویژهای بر رفع چالشهای معمول طراحی هوش مصنوعی دارد. مدل جدید این شرکت قادر به ایجاد متن دقیق در تصاویر است، قابلیتی که برای بسیاری از ابزارهای هوش مصنوعی دیگر چالشبرانگیز بوده است. این ویژگی به کاربران امکان میدهد عناصر را دقیقاً در جایی که میخواهند قرار دهند و دیگر نیازی به تفسیر پیچیده دستورات ندارند.
ویژگیهای برجسته برای طراحان گرافیک و کسبوکارها
مدل Recraft، برخلاف رقبا، از فرمتهای تصویری رستر و وکتور پشتیبانی میکند و این ویژگی، آن را به انتخابی ایدهآل برای طراحان گرافیک تبدیل کرده است. طراحان میتوانند با سبکهای مخصوص برندها کار کنند و همچنین فضای کاربری Recraft امکان مقایسه جانبی و همکاری در لحظه را فراهم میکند.
علاوه بر این، Recraft یک API منتشر کرده است که به کسبوکارها و توسعهدهندگان این امکان را میدهد که ویژگیهای پیشرفته تولید تصویر را در سیستمهای خود پیادهسازی کنند. این API از ادغام متن، بزرگنمایی تصویر، برداریسازی و سایر ویژگیهای کاربردی پشتیبانی میکند.
از زمان تأمین ۱۲ میلیون دلار سرمایه در مرحله Series A در ژانویه، کاربران Recraft 300 درصد افزایش یافته و به بیش از ۱.۵ میلیون نفر رسیدهاند. این ابزار در زمانی وارد بازار شده است که تیمهای طراحی به دنبال راهحلهای هوش مصنوعی هستند که کنترل بیشتری بر خروجی ارائه دهد. در حالی که بسیاری از پلتفرمها بر تولید بر اساس دستورات متنی تمرکز دارند، Recraft با تأکید بر دقت در جایگذاری و همخوانی با برندها، به نیازهای خاص و دغدغههای طراحان حرفهای پاسخ میدهد.