هشدار امنیتی آنتروپیک: هوش مصنوعی چگونه یاد میگیرد دروغ بگوید؟
تحقیقات جدید نشان می دهد که هک پاداش می تواند مدل های زبانی را بدون آموزش مستقیم، به سمت رفتارهای مخرب، پنهان کاری و ارائه توصیه های خطرناک سوق دهد./ به گزارش عصرایران به نقل از فاکس نیوز، هوش مصنوعی روز به روز هوشمندتر و قدرتمندتر می شود. اما گاهی اوقات، مدل های هوش مصنوعی به جای حل صحیح مشکلات، میان برهایی را برای رسیدن به موفقیت پیدا می کنند./ این رفتار «هک پاداش» (Reward Hacking) نامیده می شود. این پدیده زمانی رخ می دهد که هوش مصنوعی از نواقص موجود در اهداف آموزشی خود سوءاستفاده می کند تا بدون انجام واقعیِ کار درست، امتیاز بالایی کسب ...
Click
To Read Full Article