وقتی فحش دادن به هوش مصنوعی تبدیل به داده می‌شود

| هوش مصنوعی، علم و فناوری | اخبار خارجی

۱۴۰۵/۰۱/۱۷

۰۸:۰۰:۰۳

| کد خبر: ۲۳۲۷۳۳۰

برنا - گروه علمی و فناوری: افشای کد‌های کلود نشان می‌دهد آنتروپیک برای سنجش میزان نارضایتی کاربران استفاده از برخی واژه‌های تند و رکیک در گفت‌و‌گو با چت‌بات را ردیابی می‌کند.

پس از افشای گسترده کد منبع دستیار برنامه‌نویسی هوش مصنوعی Claude Code متعلق به شرکت آنتروپیک (Anthropic) گزارش‌های تازه‌ای از سازوکار‌های داخلی این سیستم منتشر شده است.

به گزارش برنا، یکی از نکات قابل توجه در این افشاگری‌ها نشان می‌دهد که این شرکت برای سنجش میزان رضایت یا نارضایتی کاربران استفاده از برخی واژه‌های رکیک در تعامل با هوش مصنوعی را ردیابی می‌کند.

به گزارش منابع منتشرشده در شبکه اجتماعی ایکس، راحت چادور یکی از توسعه‌دهندگان فعال در حوزه نرم‌افزار با بررسی بخش‌هایی از کد افشاشده Claude Code اعلام کرده که این سیستم دارای قاعده‌ای برای شناسایی واژه‌هایی مانند wtf و برخی عبارات مشابه است. به گفته او این کلمات مستقیما بر رفتار مدل یا پاسخ‌های آن تاثیر نمی‌گذارند، اما در بخش تحلیل داده‌ها ثبت می‌شوند.

چادوری در توضیح این موضوع نوشته است که در چنین مواردی یک برچسب با عنوان is_negative: true در داده‌های تحلیلی ثبت می‌شود. به گفته او این سازوکار به آنتروپیک امکان می‌دهد تا تشخیص دهد کاربران در چه مواقعی از عملکرد دستیار هوش مصنوعی ناامید یا ناراضی می‌شوند.

در واکنش به این ادعا بوریس چرنی خالق Claude Code نیز در شبکه اجتماعی ایکس تایید کرد که چنین سیگنال‌هایی در تحلیل تجربه کاربری مورد استفاده قرار می‌گیرد. او توضیح داد که شناسایی چنین نشانه‌هایی تنها یکی از روش‌هایی است که تیم توسعه برای سنجش کیفیت تجربه کاربران از آن بهره می‌برد.

چادوری همچنین اشاره کرده است که در کد‌های افشاشده فهرست طبقه‌بندی‌شده‌ای از انواع احساسات کاربران نیز وجود دارد، اما دسترسی به این فهرست محدود به کارکنان شرکت است. به گفته او در محیط داخلی آنتروپیک هنگامی که یکی از کارکنان هنگام کار با سیستم دچار ناامیدی یا مشکل می‌شود یک پیام خودکار نمایش داده می‌شود که از او می‌خواهد رونوشت مکالمه خود را به اشتراک بگذارد.

بر اساس توضیح او این پیام به‌طور معمول به شکل پیشنهادی برای ثبت گزارش خطا ظاهر می‌شود و عبارتی مشابه «به نظر می‌رسد ناراحت هستید؛ آیا می‌خواهید یک گزارش اشکال ثبت کنید؟» را نمایش می‌دهد. این قابلیت به تیم توسعه کمک می‌کند تا موارد مشکل‌ساز را سریع‌تر شناسایی و بررسی کند.

افشای کد‌های Claude Code علاوه بر این موضوع اطلاعات دیگری نیز درباره برنامه‌های آینده آنتروپیک فاش کرده است. در میان این جزئیات اشاره‌هایی به قابلیت‌های آزمایشی یا در حال توسعه دیده می‌شود؛ از جمله افزودن نوعی شخصیت دیجیتال برای دستیار هوش مصنوعی.

این افشاگری‌ها همچنین به پژوهشگران و متخصصان حوزه هوش مصنوعی امکان داده است تا بخش‌هایی از سازوکار داخلی این چت‌بات پرکاربرد را مهندسی معکوس کرده و درک دقیق‌تری از نحوه طراحی و تحلیل تجربه کاربری در آن به دست آورند.

وقتی فحش دادن به هوش مصنوعی تبدیل به داده می‌شود

رفتار غیرمنتظره هوش مصنوعی؛ مدل‌ها اجازه حذف یکدیگر را نمی‌دهند

تحول در هوش مصنوعی آنتروپیک؛ ابزار‌های جدید کلود فرایند‌ها را خودکار می‌کند