این مدل هوش مصنوعی جدید میتواند متنهای 10 هزار کلمهای تولید کند
تیمی از محققان هوش مصنوعی در دانشگاه Tsinghua چین یک مدل زبان بزرگ به نام “LongWriter” ساخته اند که سازندگان ادعا می کنند می تواند خروجی متن تا ۱۰۰۰۰ کلمه را تولید کند. با توجه به اینکه مدل های رایج فعلی می توانند خروجی تا حدود ۲ هزار کلمه داشته باشند، LongWriter در زمینه نوشتن متون طولانی بسیار کارآمدتر خواهد بود. همچنین این مدل متن باز است و توسعه دهندگان می توانند آن را بهبود ببخشند.
طبق گزارش Tech Xplore، حداکثر خروجی متن مدلهای فعلی هوش مصنوعی تقریباً ۲۰۰۰ کلمه است. محققان حدس می زنند که دلیل آن این است که این مدل ها با محتوای کوتاه آموزش داده شده اند. محققان میخواستند ببینند اگر مدل خود را با استفاده از محتوای طولانیتر آموزش دهند، خروجی آنها طولانیتر میشود یا خیر.
هوش مصنوعی با خروجی ۱۰ هزار کلمه
محققان برای آزمایش ایده خود، ابتدا مدل ۹ میلیارد پارامتری را با استفاده از یک مجموعه داده معمولی متشکل از محتوای کمتر از ۲۰۰۰ کلمه آموزش دادند. همانطور که انتظار میرفت، این مدل نمیتوانست متنهایی با بیش از ۲۰۰۰ کلمه در طول مکالمه تولید کند.
در مرحله بعد، محققان دادهها را جمعآوری کردند، مجموعهای به نام LongWriter-6k که شامل ۶۰۰۰ متن نوشته شده از ۲۰۰۰ تا ۳۲۰۰۰ کلمه بود. آنها سپس LLM خود را با استفاده از مجموعه داده جدید آموزش دادند و دریافتند که با انجام این کار، طول مواد خروجی به تقریباً ۱۰۰۰۰ کلمه افزایش یافت.
این مدل جدید منبع باز است و در GitHub منتشر شده است. با چنین مدلی، کاربران بهتر می توانند مقاله، کتاب یا فیلمنامه در زمینه های مختلف تولید کنند. البته با توجه به اینکه چنین مدلی می تواند یک اثر مکتوب کامل تولید کند، محققان می گویند ملاحظات اخلاقی نیز باید در نظر گرفته شود.
مدتی پیش، OpenAI از مدل خروجی طولانی GPT-4o رونمایی کرد که به کاربران اجازه میدهد تا پاسخهای طولانی را به اندازه یک رمان ۲۰۰ صفحهای دریافت کنند.
منبع: دیجیاتو