🔸در جریان رویداد معرفی GPT-5 که شب گذشته برگزار شد، OpenAI چند نمودار را نمایش داد که عملکرد مدل جدید را بسیار چشمگیر نشان میدادند. اما با کمی دقت، مشخص شد برخی از این نمودارها مشکل بزرگی دارند که باعث میشود مصرفکنندگان درک درستی از پیشرفت GPT-5 نداشته باشند.
🔸یکی از نمودارهای نمایش داده شده مربوط به ارزیابی «فریب» مدلها بوده که مقیاس آن بهطور عجیبوغریبی نامرتب بوده است. برای مثال، در بخش «فریب در کدنویسی»، نمودار روی صحنه نشان میداد که GPT-5 در حالت «با تفکر» نرخ فریب ۵۰ درصدی دارد. این عدد با نرخ ۴۷.۴ درصدی مدل کوچکتر o3 مقایسه شده بود، اما ستون مربوط به o3 به شکل غیرمنطقی بلندتر ترسیم شده است.
🔸نکته جالب دیگر اینکه در وبلاگ رسمی OpenAI ارقام متفاوت و درستتری وجود دارد و در آن نرخ فریب GPT-5 برابر با ۱۶.۵ درصد ذکر شده است.
🔸🔸🔸
🟣 Digiato
🎞 Digiatoofficial
🤖 Digiato
💭 @Digiato