آغاز عصر جدید هوش مصنوعی/ عرضه مدلهای Qwen3 توسط علیبابا – افق میهن
Alibaba مدل های جدیدی را برای هوش مصنوعی QWEN3 معرفی کرد که در برخی موارد از بهترین مدل های Google و OpenAI فراتر رفت.
Alibaba ، یکی از بزرگترین شرکت های فناوری چین ، روز دوشنبه مجموعه جدیدی از مدل های اطلاعاتی مصنوعی به نام QWEN3 را ارائه داد. طبق این مدل ها ، این مدل ها می توانند بهترین مدل های موجود در بازار از جمله OpenAI و Google را رقابت کنند و حتی از آن بهتر عمل کنند. مدل های QWEN3 به زودی از مجوز “باز” باز از سیستم عامل های توسعه هوش مصنوعی مانند Hugging Face و Github بارگیری می شوند. این مدل ها در اندازه های مختلف از ۰.۶ تا ۲۳۵ میلیارد پارامتر در دسترس خواهند بود. پارامترها تقریباً عملکردهای مشکل یک مدل را نشان می دهد و به طور کلی مدل هایی با پارامترهای بیشتر بهتر قطع می شوند.
افزایش فشار بر روی آزمایشگاه های آمریکایی
ظهور مدلهای جدید مانند QWEN3 آزمایشگاه های آمریکایی را تحت فشار بیشتری از جمله OpenAi قرار داده است تا فناوری های قوی تری برای هوش مصنوعی فراهم کنند. این امر باعث شده است كه تصمیم گیرندگان تصمیم سیاسی آمریكا بتوانند توانایی شرکتهای چینی در دسترسی به تراشه هایی را كه برای آموزش مدلهای هوش مصنوعی مورد نیاز است ، كاهش دهند.
مدل های QWEN3 نوعی “ترکیبی” هستند ، به این معنی که می توانید به آرامی و به سرعت مشکلات پیچیده را برای سوالات ساده حفظ کنید. تیم QWEN در یک پست وبلاگ گفت: “ما حالت های تفکر و نه فکر را یکپارچه کرده ایم و کاربران را قادر می سازد تا بودجه تفکر خود را کنترل کنند.” با استفاده از این طرح ، کاربران می توانند به راحتی بودجه های خاصی را برای کارهای خود پیکربندی کنند.
معرفی توابع جدید
مدل های QWEN3 از معماری “MOE” (MOE) استفاده می کنند که می تواند برای پاسخ به سوالات کارآمدتر عمل کند. معماری MOE وظایف را به وظایف تقسیم می کند و آنها را به مدلهای “متخصصان” کوچکتر و تخصصی تر واگذار می کند. Alibaba اعلام کرده است که مدل های QWEN3 از ۱۱۹ زبان پشتیبانی می کنند و در مورد داده های تقریباً ۳۶ تریلیون نشانه آموزش داده می شوند. توکن داده های خام در نظر گرفته می شود که یک مدل پردازش می شود. حدود ۱ میلیون نشانه ۷۵۰،۰۰۰ کلمه است.
مدل های QWEN3 با ترکیبی از کتابهای درسی “زوج های سؤال و پاسخ” ، کدهای مثال و داده های ایجاد شده توسط هوش مصنوعی آموزش داده می شوند. علی بابا ادعا می کند که این پیشرفت ها عملکردهای QWEN3 را در مقایسه با نسخه قبلی خود QWEN2 افزایش داده است. اگرچه هیچ یک از مدل های QWEN3 به طور کامل از آخرین مدل های OpenAI مانند O3 و O4-Mini فراتر رفته است ، اما خوب کار می کنند.
رقابت با مدل های دیگر
بزرگترین QWEN3 ، QWEN-3-235B-A22B ، تا حدی بستر برنامه نویسی CodeForces را Mini-Pro-Mini O3 از OpenAAI و Google’s Gemini 2.5 Pro قرار داد. علاوه بر این ، این مدل عملکرد بهتری در نسخه جدید AIME دارد که یک معیار ریاضی چالش برانگیز است و BFCL که توانایی “تفکر” یک مدل را ارزیابی می کند ، بهتر از O3 Mini است.
با این حال ، QWEN-3-235B-A22B هنوز برای مصارف عمومی در دسترس نیست. بزرگترین مدل کلی QWEN3 ، QWEN3-32B ، همچنان با چندین مدل دیگر برای هوش مصنوعی به رقابت می پردازد و در چندین تست Openi Openai از جمله آزمون برنامه نویسی LiveCodebench فراتر می رود. Alibaba اعلام کرده است که QWEN3 حاوی داده های خوبی در ابزارهای ابزار است و به دنبال آن دستورالعمل ها و نسخه های خاصی را کپی می کند.
“Co -Catcher و مدیرعامل Basertens ، گفت:” مدل های QWEN3 نقطه عطفی در فرآیند مدلهای پیشرفت ، همراه با سیستم های بسته مانند OpenAAI است. ” ایالات متحده با فروش تراشه برای چین و خرید از چین تقویت می شود ، اما مدل هایی مانند QWEN3 که در سراسر جهان و باز هستند مطمئناً در آلمان استفاده می شوند. “