ورود و ثبت نام
ورود و ثبت نام

خواندن این مطلب 3 دقیقه زمان میبرد!

مدل زبانی ‌BERT large با عنوان «توکا» برای اولین بار در ایران به زبان فارسی با ۹۰ میلیارد توکن به صورت متن‌باز توسط مرکز تحقیقات هوش مصنوعی پارت منتشر شد.

به گزارش پیوست به نقل از روابط عمومی پارت، مدل زبانی ‌BERT large با عنوان «توکا» به زبان فارسی توسط مرکز تحقیقات هوش مصنوعی پارت برای اولین بار در ایران توسعه داده شده است. این مدل زبانی با هدف تسهیل توسعۀ محصولات هوشمند، به شکل منبع‌باز در اختیار علاقه‌مندان و کسب‌وکارها قرار گرفته است.

گروه دانش‌بنیان پارت علاوه بر نسخه large این مدل زبانی، نسخه پایه آن را نیز به صورت متن‌باز ارائه کرده تا زیست‌بوم هوش مصنوعی کشور را در لبه فناوری‌های روز دنیا نگه دارد.

این مدل زبانی، با ظرفیت داده ۵۰۰ گیگابایت معادل ۹۰ میلیارد توکن، یکی از بهینه‌ترین مدل‌ها برای استفاده در سرویس‌های فارسی‌زبان شناخته می‌شود و به دلیل برخورداری از دقت و کیفیتی بالا، در مقایسه با دیگر مدل‌های مشابه فارسی در جایگاه نخست قرار می‌گیرد. همچنین از آنجا که مدل زبانی «توکا»، قابلیت اجرا و آموزش روی سخت‌افزارهای نه‌چندان قدرتمند را فراهم می‌کند، مناسب‌ترین گزینه برای اهداف تحقیقاتی، توسعه‌دهندگان شخصی و کسب‌وکارهای نوپا است.

با ساندویچ پانل های سقفی و دیواری آریا بارون ساخت و ساز کم هزینه و سریع را از دست ندهید!
بیشتر بخوانید: با ساندویچ پانل های سقفی و دیواری آریا بارون ساخت و ساز کم هزینه و سریع را از دست ندهید!

 انتشار نسخه متن‌باز این مدل زبانی، امکان دسترسی ساده و رایگان و مشارکت با دیگر توسعه‌دهندگان را برای کسب‌وکارها و برنامه‌نویسان فراهم می‌کند. علاوه بر این، فرصتی ایجاد می‌کند تا از یک سو، توسعه‌دهندگان و برنامه‌نویسان بتوانند ابزارهای قدرتمندتر و کاربردی‌تری را برای مخاطب فارسی زبان توسعه دهند و از سوی دیگر، کسب‌وکارها این امکان را داشته باشند تا محصولات سفارشی‌سازی‌شده و منطبق با نیاز کاربران خود را ایجاد کنند و در نتیجه، همه اجزای زیست‌بوم فناوری ایران در کنار یکدیگر و همگام با هم، رشد و پیشرفت قابل‌ملاحظه‌ای را تجربه کنند.

مدل زبانی «توکا» طی سال‌های گذشته، در محصولات پارت همچون سرویس‌های هوشمند ابری سهاب، سرویس تبدیل صوت به متن «آوانگار»، سرویس تبدیل متن به صوت «آواشو»، چت‌بات هوشمند «دانابات» و سرویس تبدیل تصویر به متن «نویسه‌نگار» به‌کار گرفته شده و عملکردی فوق‌العاده به نمایش گذاشته و زمینه استفاده از ابزارهای هوشمند تعاملی را برای میلیون‌ها کاربر فارسی‌زبان فراهم کرده است.

گروه دانش‌بنیان پارت اخیرا خبری مبنی بر توسعه مدل زبانی بزرگ درنا با ۱۳ میلیارد پارامتر را منتشر کرد و این مدل‌بزرگ زبانی در حال جایگزینی با مدل «توکا» در محصولات پارت است. پس از جایگزینی توکا با مدل بزرگ زبانی درنا در سرویس‌های هوشمند این مجموعه، در سال جاری، شاهد استفاده‌های تجاری از مدل بزرگ توکا در محصولات این شرکت خواهیم بود.

منبع

دسته بندی مطالب

محصولات جدید

61%
دامنه ehsan-teb.ir
تومان
850,000
2,200,000
ارائه خدمات ثبت دامنه
تومان
215,000
55%
دامنه Vrasty.ir
تومان
4,500,000
10,000,000
50%
دامنه ReadyMusic.ir
تومان
2,500,000
5,000,000
30%
دامنه RahePayam.ir
تومان
3,500,000
5,000,000
76%
دامنه KetabSetan.ir
تومان
1,200,000
5,000,000

جستجو کنید ...

تبلیغات

نظرات کاربـــران
فاقد دیدگاه
دیدگاهی برای این مطلب ثبت نشده است. اولین دیدگاه را شما بنویسید.
ثبت دیدگاه
مطالب مرتبـــط