ترندهای روز

۳۰ ریاضی‌دان مطرح از عملکرد هوش مصنوعی در حل مسائل پیچیده شگفت‌زده شدند

افق میهن پایگاه داده اخبار تحلیلی (ofoghmihan.ir):

در جلسه ای در کالیفرنیا ، پنج نفر از برجسته ترین ریاضیدانان جهان در یک رویارویی مستقیم توانایی های مدل پیشرفته هوش مصنوعی را برای حل مشکلات دشوار ارزیابی کردند. نتیجه تعجب و تحسین شد: مدل استدلال چتپت توانست مسائل دکتری بسیار پیچیده ای را حل کند.

به گفته Live Science ، یک رویداد علمی منحصر به فرد و محرمانه در اواسط ماه مه امسال برگزار شد. سه نفر از نبوغ ریاضی جهان از سراسر جهان برای آزمایش مدل بازرسی Openai O4-Mini در یک آزمایش دو روزه جمع شدند. هدف از این مشکل برای یک ریاضیدان حرفه ای چالش برانگیز بود.

مسائل ریاضی دشوار برای chatgpt

این رویارویی بخشی از یک پروژه معیار به نام Frontiermath بود که توسط سازمان غیرانتفاعی Epoch AI انجام شد. هدف از ارزیابی توانایی واقعی هوش مصنوعی استدلال و حل موضوعاتی بود که قبلاً در اینترنت منتشر نشده بودند و مدل نه تنها با جستجو می تواند پاسخ داده شود. برای جلوگیری از هرگونه کلاهبرداری ناخواسته ، تمام ارتباطات بین شرکت کنندگان از طریق برنامه سیگنال ایمن انجام شد و آنها متعهد بودند که اطلاعات را فاش نکنند.

در ابتدا ، ریاضیدانان با مطرح کردن موضوعات پیچیده در به چالش کشیدن هوش مصنوعی موفق بودند. برای هر مشکلی که چت ها نتوانستند آن را حل کنند ، طراح جایزه ۲۰۰۰ دلار دریافت کرد. اما همه چیز تغییر کرد.

کن اونو ، ریاضیدان برجسته از دانشگاه ویرجینیا و یکی از داوران این رویداد ، می گوید که چگونه او از عملکرد بات ناامید شد. اما او در “نظریه اعداد” در سطح دکترا یک مسئله حل نشده را مطرح کرد. اتفاقی که در ۵ دقیقه آینده افتاد شگفت زده شد:

این ربات ابتدا دو دقیقه را صرف یافتن و تسلط بر تمام مقالات علمی مربوط به آن زمینه کرد. سپس او در صفحه نوشت که برای یادگیری ، ابتدا قصد دارد نسخه ساده تری از همان مشکل را حل کند. چند دقیقه بعد ، وی اعلام کرد که اکنون آماده حل مشکل اصلی و دشوارتر است. پنج دقیقه بعد ، طبق گفته پروفسور اونو ، “بی ادب” ، O4-Mini کاملاً درست و در همان زمان ارائه داد. هوش مصنوعی در پایان گفت: “من لازم نیست که آن را در جایی ذکر کنم ، زیرا خودم آن را حل کردم.”

پروفسور می گوید: “من همکاران دارم که به معنای واقعی کلمه گفتند این مدل ها به سطح نبوغ ریاضی نزدیک می شوند.”

مدل O4-Mini ، برخلاف مدل های بزرگ زبان بزرگ که صرفاً به دنبال پیش بینی کلمه بعدی هستند ، یک LLM منطقی است. این مدل ها در یک مجموعه داده تخصصی با بازخورد بسیار قوی تر انسانی آموزش داده می شوند. این رویکرد به آنها امکان می دهد به جای تکرار اطلاعات و نمایش روند استدلال خود ، مرحله ای از مسائل پیچیده را به دست آورند.

منبع: دیجیاتو

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا