«چتجیپیتی» از خبرنگاران انسانی جا ماند
Chatgpt نتوانست در یک آزمون نوشتن خبری علمی خوب عمل کند و در اخبار علمی قابل درک روزنامه نگاران انسانی باقی مانده است.
به گفته افق میهن ، ناشر تبلیغات علمی آمریکا (AAAS) اخیراً حکم صادر کرده است که می تواند کسانی را که علاقه مند به هوش مصنوعی هستند شگفت زده کند.
این سازمان گفت: chatgpt chatgpt نتوانسته است کارهای ظریف تبدیل تحقیقات پیچیده به درک علمی درک را انجام دهد.
انجمن آمریکایی برای ارتقاء علوم آمریکا یک سال را آزمایش کرده است که آیا هوش مصنوعی می تواند نویسندگان انسانی را برابر کند. نتایج این آزمایش خیلی خوشایند نبود.
محققان انجمن ارتقاء علوم آمریکا از دسامبر تا ۵ دسامبر حدود ۴ مقاله علمی چالش برانگیز را در مورد گپ ارسال کرده اند. آنها به طور عمدی سخت ترین مقالات پر از اصطلاحات فنی ، نتایج بحث برانگیز ، اکتشافات پیشگامانه و قالب های غیرمعمول را انتخاب کردند.
هوش مصنوعی سه دستورالعمل را با جزئیات دریافت کرد و از آخرین مدل های چت عمومی استفاده کرد که برای هر دو دوره GPT-4 و GPT 4O در دسترس است. هر خلاصه توسط اومانیست ها ارزیابی شده است که مرتباً برای علم و Euralert محتوا تولید می کنند.
آمار این آزمایش داستان تکان دهنده را بیان می کند. در مورد سؤال از متخصصان ارزیابی در مورد اینکه آیا خلاصه چت می تواند در محتوای نوشته شده توسط انسان ادغام شود ، میانگین امتیاز آنها فقط از ۵ از ۵ بود. فاکتور “جذاب” حتی به ارزیابی پایین تر از ۱.۲ دست یافت.
فقط یک نفر از خلاصه نمره کامل را از کارشناسان ارزیابی دریافت کرد و خلاصه ای از این خلاصه کوچکترین امتیاز ممکن داده شد.
بازخورد کیفی الگوهای خاص را در گپ چت نشان داد. هوش مصنوعی دائماً همبستگی را با علیت اشتباه می گرفت ، این یک اشتباه اساسی است که باعث تضعیف دقت علمی می شود. هوش مصنوعی دائماً محتوای مهم مورد نیاز متخصصان برای درک صحیح تحقیقات را حذف می کرد.
شاید مشکل ساز ترین مورد با اغراق باشد. کلماتی مانند “پیشگام” و “جدید” بارها و بارها تکرار شده و اهمیت دانش عادی را برطرف کرده اند.
ابیگیل آیزنستاد ، نویسندگان انجمن علوم آمریکا گفت: “این فناوری ها ممکن است این امکان را داشته باشند که به سیستم های کارآمد برای نویسندگان علمی تبدیل شوند ، اما برای اوج زمان آماده نیستند.”
Chatgpt در اولین رونویسی از مقالات شایستگی هایی را نشان داد ، اما روزنامه نگاری علمی باید ترجمه شود و هیچ رونویسی وجود ندارد.
نوشتن محتوای علمی واقعی نیاز به یک بررسی جامع از روش ها ، پذیرش محدودیت ها و ارتباطات به پیامدهای جامع تر دارد. اگر مقالات چندین نتیجه متناقض را نشان می داد یا دو مطالعه مرتبط با هم ترکیب می شدند ، هوش مصنوعی کاملاً دشوار بود.
محققان دریافتند که حتی گپ زدن به عنوان نقطه شروع کار بیشتری را نسبت به نوشتن از ابتدا ایجاد می کند. بررسی گسترده حقایق لازم هر بار پس انداز را از بین می برد.
این یافته ها مطابق با سؤالات مربوط به هوش مصنوعی است. مطالعات اولیه نشان داده اند که موتورهای جستجو برای هوش مصنوعی در ۵ ٪ موارد ، منابع نادرست را ذکر می کنند. در ارتباطات علمی ، که مهمترین دقت است ، چنین اشتباهی غیرقابل قبول است.
محققان انجمن ارتقاء علوم آمریکا دریافتند که مطالعه آنها گرایش انسانی خبرنگاران را در نظر نگرفته است. با این حال ، نتایج آنقدر منفی بود که اعوجاج به تنهایی نمی تواند عملکرد ضعیف هوش مصنوعی را توضیح دهد.
Chatt توانسته است از ساختار و لحن خلاصه های حرفه ای علمی تقلید کند ، اما ساختار بدون محتوا با استانداردهای حرفه ای مطابقت ندارد.
محققان به این نتیجه رسیدند که چت با سبک و استانداردهای خلاصه بسته مطبوعات مجله علمی مطابقت ندارد. شما در هنگام ارائه به روزرسانی های مهم مصنوعی ، آزمایش های آینده را برای انجام بررسی های جدید تنظیم کرده اید. این مهم است زیرا GPT-5 در ماه آگوست در دسترس عموم بود.
در حال حاضر ، هنر پیچیده تبدیل اکتشافات علمی به درک عمومی هنوز در دست مردم است. قضاوت دقیق ، آگاهی از شرایط و صحت ، روزنامه نگاری علمی با کیفیت بالا ، روزنامه نگاری علمی با کیفیت بالا را تعریف می کند ، از آنچه پیش بینی شده است دشوارتر است.
منبع: isna