هوش مصنوعی DeepSeek چیست؟ رقیب رایگان و بدون تحریم ChatGPT
Dijiato: DeepSeek AI یک استارتاپ چینی در حال رشد است که به دلیل پیشرفت هایش در زمینه هوش مصنوعی مورد توجه جهانیان قرار گرفته است. به گفته بسیاری از کارشناسان، این شرکت چینی یکی از قدرتمندترین مدل های هوش مصنوعی رایگان به نام Deepsik را منتشر کرده است که در ادامه این مقاله به معرفی آن می پردازیم.
آخرین نسخه از مدل هوش مصنوعی این شرکت با نام DeepSeek V3 در اواخر سال ۲۰۲۴ منتشر شد و توسعه دهندگان می توانند نسخه سفارشی آن را دانلود کرده و در برنامه های خود از آن استفاده کنند. همانطور که اشاره کردیم، مدل های Dipsic کاملا متن باز هستند. توسعه دهندگان می توانند آنها را برای استفاده در برنامه ها و پروژه های خود دانلود و تغییر دهند.
این مدل هوش مصنوعی از معماری خلاقانه ای استفاده می کند که در ادامه به آن خواهیم پرداخت. این معماری آن را از بسیاری از مدلهای هوش مصنوعی قدرتمند امروزی از شرکتهایی مانند Meta و OpenAI قدرتمندتر میکند، جایی که برای استفاده از ویژگیهای پیشرفته آنها باید هزینه پرداخت کنید.
قابلیت های هوش مصنوعی DeepSeek V3 و برتری آن نسبت به رقبا
DeepSik می گوید مدل پرچمدار آن می تواند طیف گسترده ای از وظایف مبتنی بر متن مانند کدنویسی، ترجمه، و نوشتن مقاله و ایمیل را انجام دهد. همچنین در آموزش آن از پردازنده های گرافیکی H800 ویژه چین از شرکت انویدیا استفاده شده است.
DeepSeek با آزمایش های خود اعلام کرد که DeepSeek V3 بهتر از مدل های دانلودی و رایگان و مدل های غیر رایگانی که فقط از طریق API در دسترس هستند، عمل می کند. به گفته این شرکت و مطابق تصویر زیر، مدل هوش مصنوعی آن در کدنویسی از سایر مدلها مانند Llama 3.1 متا، GPT-4o OpenAI و Qwen 2.5، 72B شرکت چینی Alibaba بهتر عمل کرده است.
DeepSeek ادعا می کند که DeepSeek V3 با مجموعه داده ای از ۱۴ تریلیون و ۸۰۰ میلیارد توکن آموزش داده شده است. برای درک بهتر این موضوع باید گفت که هر یک میلیون توکن معادل حدود ۷۵۰ هزار کلمه است. DeepSeek V3 همچنین از نظر اندازه بسیار بزرگ است و از ۶۷۱ میلیارد پارامتر پشتیبانی می کند (پارامترها متغیرهای داخلی هستند که مدل ها از آنها برای پیش بینی یا تصمیم گیری استفاده می کنند). با این شرایط، هوش مصنوعی این شرکت تقریباً ۱.۶ برابر بزرگتر از Llama 3.1405B متا است که از ۴۰۵ میلیارد پارامتر پشتیبانی می کند.
نکته جالب دیگر این است که چینی ها مدل پرچمدار خود را تنها در ۲ ماه و با هزینه ای نزدیک به ۵.۵۸ میلیون دلار آموزش داده اند. بنابراین، این شرکت در مقایسه با شرکت های بزرگی مانند Meta و OpenAI، زمان و منابع کمتری را برای مدل هوش مصنوعی خود صرف کرده است.
معماری نوآورانه DeepSeek V3
DeepSick برای توسعه مدل خود از یک معماری بهینه شده (به نام ترکیب متخصصان یا MoE) استفاده کرده است که نیاز به قدرت محاسباتی گسترده و سخت افزار قدرتمند را کاهش می دهد. این معماری را به عنوان یک تیم (متخصص) از سیستم های تخصصی هوش مصنوعی در نظر بگیرید که در آن هر به اصطلاح “متخصص” شبکه عصبی خود را دارد و برای انجام وظایف مربوط به آن فعال می شود.
برای آزمایش نحوه عملکرد هوش مصنوعی DeepSeek، در زیر به چند نمونه اشاره کرده ایم. در مورد اول، از مدل خواسته می شود که شرح مفصلی از یک شخصیت فانتزی (ملکه ای که در برابر امپراتوری شیطانی مقاومت می کند) بنویسد. سپس DeepSeek V3 نام، عنوان، سن و ظاهر این شخصیت خیالی را افق میهن کرد و نوشت:
برای تست مهارت کد نویسی این مدل طبق مثال زیر یک کد جاوا اسکریپت معیوب به آن داده شده است. همانطور که در تصویر زیر مشاهده می کنید، دیپسیک بلافاصله متوجه مشکل شده و ضمن توضیح آن، کد اصلاح شده را برای کاربر ارسال می کند:
در مثال زیر، توانایی DeepSeek V3 در بهره وری آزمایش شده است. در آن، کاربر از هوش مصنوعی خواست تا دستور کار مختصری را برای جلسه ای درباره عرضه محصول جدید آماده کند. سپس هوش مصنوعی لیستی از موضوعات پیشنهادی قابل بحث در جلسه را به همراه زمان در نظر گرفته شده در اختیار کاربر قرار داده است:
به طور کلی، در مورد عملکرد این مدل، DeepSeek طیف گسترده ای از وظایف مانند نوشتن و عیب یابی کدهای پیچیده را به راحتی انجام می دهد. همچنین این مدل می تواند لحن و سبک نوشتن خود را بر اساس موضوعات مختلف تنظیم کند، اما DeepSeek مانند بسیاری از مدل های هوش مصنوعی دیگر ممکن است در پاسخ به موضوعات بسیار خاص اطلاعات اشتباهی ارائه دهد. همچنین به نظر می رسد DeepSeek V3 تمایلی به ارائه پاسخ در مورد موضوعات حساس تاریخی ندارد.
دسترسی به هوش مصنوعی DeepSeek V3
اکنون می توانید از نسخه وب پرچمدار چینی AI DeepSeek V3 به صورت رایگان استفاده کنید. البته برای استفاده از آن نیاز به یک حساب کاربری دارید که از طریق اکانت گوگل نیز ایجاد شود. رابط کاربری این سرویس شباهت زیادی به ChatGPT دارد و می توانید پس از ورود به حساب کاربری خود با آن چت کنید. قابل ذکر است که این مدل از زبان فارسی نیز پشتیبانی می کند و کاربران ایرانی را منع نکرده است.
علاوه بر نسخه وب، اپلیکیشن DeepSeek برای اندروید و iOS نیز موجود است.
سابقه حرفه ای من در دنیای فناوری به ۱۰ سال قبل باز می گردد. مسیری که با سخت افزار شروع شد، با نرم افزار ادامه پیدا کرد و اکنون با روزنامه نگاری فناوری در دیجیاتو ادامه دارد. من جواد هستم و نزدیک به سه دهه است که زندگی می کنم و علاوه بر دنیای تکنولوژی، عاشق فیلم و سینما، موسیقی راک کلاسیک و رئال مادرید هستم.