ارتباط با ما

مدل زبانی فارسی «توکا» با ۹۰ میلیارد توکن به صورت متن‌باز عرضه شد

مدل زبانی ‌BERT large با عنوان «توکا» برای اولین بار در ایران به زبان فارسی با ۹۰ میلیارد توکن به صورت متن‌باز توسط مرکز تحقیقات هوش مصنوعی پارت منتشر شد.

به گزارش پیوست به نقل از روابط عمومی پارت، مدل زبانی ‌BERT large با عنوان «توکا» به زبان فارسی توسط مرکز تحقیقات هوش مصنوعی پارت برای اولین بار در ایران توسعه داده شده است. این مدل زبانی با هدف تسهیل توسعۀ محصولات هوشمند، به شکل منبع‌باز در اختیار علاقه‌مندان و کسب‌وکارها قرار گرفته است.

گروه دانش‌بنیان پارت علاوه بر نسخه large این مدل زبانی، نسخه پایه آن را نیز به صورت متن‌باز ارائه کرده تا زیست‌بوم هوش مصنوعی کشور را در لبه فناوری‌های روز دنیا نگه دارد.

این مدل زبانی، با ظرفیت داده ۵۰۰ گیگابایت معادل ۹۰ میلیارد توکن، یکی از بهینه‌ترین مدل‌ها برای استفاده در سرویس‌های فارسی‌زبان شناخته می‌شود و به دلیل برخورداری از دقت و کیفیتی بالا، در مقایسه با دیگر مدل‌های مشابه فارسی در جایگاه نخست قرار می‌گیرد. همچنین از آنجا که مدل زبانی «توکا»، قابلیت اجرا و آموزش روی سخت‌افزارهای نه‌چندان قدرتمند را فراهم می‌کند، مناسب‌ترین گزینه برای اهداف تحقیقاتی، توسعه‌دهندگان شخصی و کسب‌وکارهای نوپا است.

آیا باید رمز گوشی خود را با شریک زندگیمان به - آژانس مدیا و مارکتینگ ردی استودیو بیشتر بخوانید: آیا باید رمز گوشی خود را با شریک زندگیمان به اشتراک بگذاریم؟

 انتشار نسخه متن‌باز این مدل زبانی، امکان دسترسی ساده و رایگان و مشارکت با دیگر توسعه‌دهندگان را برای کسب‌وکارها و برنامه‌نویسان فراهم می‌کند. علاوه بر این، فرصتی ایجاد می‌کند تا از یک سو، توسعه‌دهندگان و برنامه‌نویسان بتوانند ابزارهای قدرتمندتر و کاربردی‌تری را برای مخاطب فارسی زبان توسعه دهند و از سوی دیگر، کسب‌وکارها این امکان را داشته باشند تا محصولات سفارشی‌سازی‌شده و منطبق با نیاز کاربران خود را ایجاد کنند و در نتیجه، همه اجزای زیست‌بوم فناوری ایران در کنار یکدیگر و همگام با هم، رشد و پیشرفت قابل‌ملاحظه‌ای را تجربه کنند.

مدل زبانی «توکا» طی سال‌های گذشته، در محصولات پارت همچون سرویس‌های هوشمند ابری سهاب، سرویس تبدیل صوت به متن «آوانگار»، سرویس تبدیل متن به صوت «آواشو»، چت‌بات هوشمند «دانابات» و سرویس تبدیل تصویر به متن «نویسه‌نگار» به‌کار گرفته شده و عملکردی فوق‌العاده به نمایش گذاشته و زمینه استفاده از ابزارهای هوشمند تعاملی را برای میلیون‌ها کاربر فارسی‌زبان فراهم کرده است.

گروه دانش‌بنیان پارت اخیرا خبری مبنی بر توسعه مدل زبانی بزرگ درنا با ۱۳ میلیارد پارامتر را منتشر کرد و این مدل‌بزرگ زبانی در حال جایگزینی با مدل «توکا» در محصولات پارت است. پس از جایگزینی توکا با مدل بزرگ زبانی درنا در سرویس‌های هوشمند این مجموعه، در سال جاری، شاهد استفاده‌های تجاری از مدل بزرگ توکا در محصولات این شرکت خواهیم بود.

منبع

دیدگاهتان را بنویسید!

آژانس مدیا و مارکتینگ ردی استودیو
سبد خرید
empty basket

هیچ محصولی در سبد خرید نیست.