فناوری

رونمایی از مدل‌های زبانی فارسی همراه اول با حضور وزیر ارتباطات

پایگاه خبری تحلیلی ایران تحلیل (irtahlil.com):

مدل های زبان فارسی توسعه یافته همراه اول که قادر به تحلیل و یادگیری حجم زیادی از داده های متنی با هوش مصنوعی هستند، با حضور وزیر ارتباطات در الکامپ ۱۴۰۳ رونمایی شد.

به گزارش اداره کل ارتباطات شرکت ارتباطات سیار ایران، گروه MCINext در اولین روز از نمایشگاه بین المللی الکامپ ۱۴۰۳ تعدادی از مدل های زبان توسعه یافته خود از جمله Silk (با ۱.۳ میلیارد پارامتر)، آهوران (با ۸ میلیارد) را ارائه کرد. پارامترها) و آوا. (با ۱۳ میلیارد پارامتر) با حضور عیسی زارع پور وزیر ارتباطات و فناوری اطلاعات در سالن اختصاصی حمارول ۱ (سالن ۳۵).

مدل های بزرگ زبانی (LLM) سیستم های هوش مصنوعی هستند که با تجزیه و تحلیل و یادگیری از حجم زیادی از داده های متنی، قادر به تولید متن، ترجمه، پاسخ به سوالات و انجام وظایف مختلف زبانی هستند و در حال حاضر با حمایت مرکز تحقیقات توسعه همراه با اول توسعه یافته است.

مدل زبان سیلک که از ابتدا با مجموعه داده های فارسی در این شرکت آموزش داده شد، علیرغم تعداد نسبتا کم پارامترها، توانایی زبانی خوبی را به نمایش می گذارد که با ادامه روند آموزش در آینده، از نظر دانش بهتر خواهد بود. خواهد بود.

مدل اهوران بر اساس مدل چند زبانه Llama3 شرکت متا است و به عنوان پیش‌آموزش مستمر بر روی مجموعه داده فارسی توسعه داده شده است. با توجه به قابلیت های فراوان مدل پایه، ادامه آموزش باعث تقویت تولید متن به زبان فارسی شده است در حالی که سایر قابلیت های مدل تا حد زیادی حفظ شده است.

کاربردهای تجاری این مدل ها بسیار گسترده است، مانند تولید محتوای متنی خودکار، پشتیبانی مشتری از طریق چت بات ها، تجزیه و تحلیل احساسات و نظرات کاربران در شبکه های اجتماعی و ایجاد ابزارهای کمکی برای نویسندگان و مترجمان. این مدل ها می توانند به شرکت ها در افزایش بهره وری، کاهش هزینه ها و بهبود تجربه مشتری کمک کنند.

مدل آوا به منظور پاسخگویی از درون یک زمینه معین و بر اساس مدل Aya از Cohere توسعه یافته است.

برخلاف دو مدل قبلی که به سوالات عمومی پاسخ می‌دهند، این مدل نیازمند ارائه اطلاعات اولیه برای پاسخ‌گویی (RAG) است و تا حد امکان از ارائه اطلاعات مورد استفاده در حین آموزش اجتناب می‌کند. کاربرد اصلی این مدل در ربات های پاسخگوی خاص است.

علاوه بر آموزش این مدل ها، تلاش شده است تا با کمک روش های هم ترازی (RLHF و DPO) از تولید محتوای مضر جلوگیری شود.

گروه MCINext First Companion در تلاش است تا امکان استفاده عمومی از این مدل ها را در آینده نزدیک فراهم کند.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا