فناوری

نشست تخصصی معرفی مدل‌های زبانی همراه اول برگزار شد

پایگاه خبری تحلیلی ایران تحلیل (irtahlil.com):

نشست تخصصی معرفی و ارائه تعدادی از مدل های زبانی توسعه یافته توسط گروه MCINext که سیستم های مرتبط با هوش مصنوعی هستند در نمایشگاه الکامپ ۱۴۰۳ برگزار شد.

به گزارش اداره کل ارتباطات شرکت ارتباطات سیار ایران، گروه MCINext در سومین روز از نمایشگاه بین المللی الکامپ ۱۴۰۳ از تعدادی از مدل های زبان توسعه یافته خود از جمله سیلک (با ۱.۳ میلیارد پارامتر)، آهوران (با ۸ میلیارد پارامتر) رونمایی کرد. ). و آوا (با ۱۳ میلیارد پارامتر) با حضور آرش امینی، رئیس تحقیق و توسعه هوش مصنوعی MCINEXT و حامد تمورثی، مدیر ارشد فناوری MCINEXT در سالن خلیج فارس نمایشگاه بین المللی تهران، در نشست تخصصی، عملکردها را مورد بررسی قرار دادند. و ویژگی های هر یک از آنها ارائه شده است.

در این نشست علاوه بر تاکید بر توسعه محصولات مبتنی بر هوش مصنوعی، دستاوردهای این مجموعه از جمله ربات پاسخگو همراه اول و چندین مدل زبانی که برای استفاده عموم در دسترس قرار گرفته است نیز معرفی شد.

مدل های بزرگ زبانی (LLM) سیستم های هوش مصنوعی هستند که با تجزیه و تحلیل و یادگیری از حجم زیادی از داده های متنی، قادر به تولید متن، ترجمه، پاسخ به سوالات و انجام وظایف مختلف زبانی هستند و در حال حاضر با حمایت مرکز تحقیقات توسعه همراه با اول توسعه یافته است.

در ادامه هر یک از مدل های زبان اصلی گروه MCINEXT همراه اول معرفی و ارائه شد.

*مدل زبان ابریشمی

مدل زبان سیلک که از ابتدا با مجموعه داده های فارسی در این شرکت آموزش داده شد، علیرغم تعداد نسبتا کم پارامترها، توانایی زبانی خوبی را به نمایش می گذارد که با ادامه روند آموزش در آینده، از نظر دانش بهتر خواهد بود. خواهد بود.

* الگوی زبانی اهوران

مدل اهوران بر اساس مدل چند زبانه Llama3 شرکت متا است و به عنوان پیش‌آموزش مستمر بر روی مجموعه داده فارسی توسعه داده شده است. با توجه به قابلیت های فراوان مدل پایه، ادامه آموزش باعث تقویت تولید متن به زبان فارسی شده است در حالی که سایر قابلیت های مدل تا حد زیادی حفظ شده است.

کاربردهای تجاری این مدل ها بسیار گسترده است، مانند تولید محتوای متنی خودکار، پشتیبانی مشتری از طریق چت بات ها، تجزیه و تحلیل احساسات و نظرات کاربران در شبکه های اجتماعی و ایجاد ابزارهای کمکی برای نویسندگان و مترجمان. این مدل ها می توانند به شرکت ها در افزایش بهره وری، کاهش هزینه ها و بهبود تجربه مشتری کمک کنند.

*مدل زبان آوا

مدل آوا به منظور پاسخگویی از درون یک زمینه معین و بر اساس مدل Aya از Cohere توسعه یافته است.

برخلاف دو مدل قبلی که به سوالات عمومی پاسخ می‌دهند، این مدل نیازمند ارائه اطلاعات اولیه برای پاسخ‌گویی (RAG) است و تا حد امکان از ارائه اطلاعات مورد استفاده در حین آموزش اجتناب می‌کند. کاربرد اصلی این مدل در ربات های پاسخگوی خاص است.

علاوه بر آموزش این مدل ها، تلاش شده است تا با کمک روش های هم ترازی (RLHF و DPO) از تولید محتوای مضر جلوگیری شود.

علاقه مندان می توانند از طریق آدرس به این مدل های زبان دسترسی داشته باشید.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا