وقتی فحش دادن به هوش مصنوعی تبدیل به داده میشود
پس از افشای گسترده کد منبع دستیار برنامهنویسی هوش مصنوعی Claude Code متعلق به شرکت آنتروپیک (Anthropic) گزارشهای تازهای از سازوکارهای داخلی این سیستم منتشر شده است.
به گزارش برنا، یکی از نکات قابل توجه در این افشاگریها نشان میدهد که این شرکت برای سنجش میزان رضایت یا نارضایتی کاربران استفاده از برخی واژههای رکیک در تعامل با هوش مصنوعی را ردیابی میکند.
به گزارش منابع منتشرشده در شبکه اجتماعی ایکس، راحت چادور یکی از توسعهدهندگان فعال در حوزه نرمافزار با بررسی بخشهایی از کد افشاشده Claude Code اعلام کرده که این سیستم دارای قاعدهای برای شناسایی واژههایی مانند wtf و برخی عبارات مشابه است. به گفته او این کلمات مستقیما بر رفتار مدل یا پاسخهای آن تاثیر نمیگذارند، اما در بخش تحلیل دادهها ثبت میشوند.
چادوری در توضیح این موضوع نوشته است که در چنین مواردی یک برچسب با عنوان is_negative: true در دادههای تحلیلی ثبت میشود. به گفته او این سازوکار به آنتروپیک امکان میدهد تا تشخیص دهد کاربران در چه مواقعی از عملکرد دستیار هوش مصنوعی ناامید یا ناراضی میشوند.
در واکنش به این ادعا بوریس چرنی خالق Claude Code نیز در شبکه اجتماعی ایکس تایید کرد که چنین سیگنالهایی در تحلیل تجربه کاربری مورد استفاده قرار میگیرد. او توضیح داد که شناسایی چنین نشانههایی تنها یکی از روشهایی است که تیم توسعه برای سنجش کیفیت تجربه کاربران از آن بهره میبرد.
چادوری همچنین اشاره کرده است که در کدهای افشاشده فهرست طبقهبندیشدهای از انواع احساسات کاربران نیز وجود دارد، اما دسترسی به این فهرست محدود به کارکنان شرکت است. به گفته او در محیط داخلی آنتروپیک هنگامی که یکی از کارکنان هنگام کار با سیستم دچار ناامیدی یا مشکل میشود یک پیام خودکار نمایش داده میشود که از او میخواهد رونوشت مکالمه خود را به اشتراک بگذارد.
بر اساس توضیح او این پیام بهطور معمول به شکل پیشنهادی برای ثبت گزارش خطا ظاهر میشود و عبارتی مشابه «به نظر میرسد ناراحت هستید؛ آیا میخواهید یک گزارش اشکال ثبت کنید؟» را نمایش میدهد. این قابلیت به تیم توسعه کمک میکند تا موارد مشکلساز را سریعتر شناسایی و بررسی کند.
افشای کدهای Claude Code علاوه بر این موضوع اطلاعات دیگری نیز درباره برنامههای آینده آنتروپیک فاش کرده است. در میان این جزئیات اشارههایی به قابلیتهای آزمایشی یا در حال توسعه دیده میشود؛ از جمله افزودن نوعی شخصیت دیجیتال برای دستیار هوش مصنوعی.
این افشاگریها همچنین به پژوهشگران و متخصصان حوزه هوش مصنوعی امکان داده است تا بخشهایی از سازوکار داخلی این چتبات پرکاربرد را مهندسی معکوس کرده و درک دقیقتری از نحوه طراحی و تحلیل تجربه کاربری در آن به دست آورند.
انتهای پیام/