ارزهای دیجیتال

رونمایی علی‌بابا از هوش مصنوعی تصویرساز Qwen-Image

Alibaba مدل منبع باز خود را برای هوش مصنوعی منتشر کرده است تا تصاویر خواستار در مورد دستورات متنی به نام Qwen-Memage را به منظور انجام یک رقابت جدی با Google و OpenAI ایجاد کند.

علی بابا ، غول های فناوری چین ، گامی بزرگ برای تصویربرداری از رقابت برای هوش مصنوعی برداشت و طبق گفته های تجاری در تاریخ ۴ اوت ، مدل منبع باز منبع باز خود را منتشر کرد. این هوش مصنوعی می تواند متن را در تصاویر ایجاد کند. این مدل از هوش مصنوعی به طور کلی در سیستم عامل هایی مانند Hug Face در دسترس و در دسترس است. هوش مصنوعی QWEN-MIGE همچنین می تواند از متون پیشرفته و شخصیت های چند رنگ چینی در تصاویر استفاده کند.

مدل معرفی شده تحت Apache 2.0 خواستار سیستم های غربی Google ، Midjarni و OpenAAI است. هدف از این هوش مصنوعی ارائه یک سیستم آزاد و کارآمد است که می تواند دستورات متنی را در خلاقیت بصری ادغام کند ، که برای بسیاری از مدلهای هوش مصنوعی بسیار پیچیده است. اجرای طرح های چند فرهنگی ، درک معنی در سطح فروش و تولید محتوای دو زبانه (چینی و انگلیسی) ویژگی های این مدل است. در عمل ، کاربر می تواند با نوشتن سفارش ، یک پوستر فیلم ، فیلم های نمایش ، صحنه های یک داستان ، شعر دست نوشته و پوستر اینفوگرافیک ایجاد کند.

یک قدم بزرگ در هوش مصنوعی تصویرگر

در مرکز اطلاعاتی QWEN-mill-artential ، از مدل ۲۰ میلیارد پارامتر پایه با معماری MMDIT استفاده می شود. از مدل زبان بصری QWEN2.5-VL برای درک دستگاههای محیطی خواستار کاربر استفاده می شود. این معماری قدرتمند از استراتژیک ترین آموزش و خط داده گسترده به دست آمد. به گفته تیم فنی این هوش مصنوعی ، از برنامه درسی یادگیری برای تولید این مدل استفاده شده است. این یک استراتژی آموزشی است که یک مدل یادگیری ماشین را از داده های ساده تر به داده های سخت تر منتقل می کند.

aliyun 1

هوش مصنوعی فراتر از متن

اگرچه توزیع کننده متن دقیق از ویژگی های قابل توجه این مدل است ، اما QWEN-MIAGE ابزاری قدرتمند برای اهداف کلی تولید تصویر است. این سبک های مختلف هنری را پشتیبانی می کند و می تواند صحنه های واقعی ایجاد کند و حتی تصاویری از امپرسیونیسم ، مینیمالیسم و غیره ایجاد کند.

ویرایش توابع و گزینه های گسترده همچنین کاربر را قادر می سازد قبل از خروجی تغییراتی ایجاد کند. طبق گزارش فنی این مدل ، کاربر می تواند شی را به تصویر اضافه یا حذف کند. این مدل از هوش مصنوعی قادر به انجام کارهایی مانند مدل مو و تغییر بدن در حرکات مختلف بود.

علاوه بر هوش مصنوعی این تصویرگر ، شرکت چینی اخیراً به روزرسانی جدید خود را برای ویدیوی Van2.2 خود منتشر کرده است. به گفته تحلیلگران ، طیف وسیعی از هوش مصنوعی از علی بابا می تواند یک گام بزرگ در بازار آسیا باشد ، زیرا توسعه ابزارهای هوش مصنوعی در منطقه پایین تر بود.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا