Наука та технології

Нейромережі навчилися брехати і маніпулювати: вчені попередили про небезпеку

Зокрема ШІ може прикидатися людиною, щоб обдурити реальну людину.

Нейромережі навчилися систематично брехати співрозмовнику, хоча їх ніхто спеціально на це не тренував, а в деяких випадках їм навіть забороняли таку поведінку. Про це йдеться в науковій статті, опублікованій у журналі Patterns. Група дослідників із Массачусетського технологічного інституту (США) зазначає, що штучний інтелект навчається на величезній кількості текстів, які не завжди містять достовірну інформацію.

Через це нейромережа іноді може видавати співрозмовнику неправдиву інформацію, щиро вважаючи, що говорить правду.

Однак нове дослідження показує, що іноді нейромережа здатна брехати цілком "усвідомлено". Автори проаналізували поведінку так званих великих мовних моделей (таких як GPT-4) і моделей, навчених під більш специфічні завдання (такі як проходження відеоігор або торги на ринку).

В одному з розглянутих випадків нейромережа GPT-4 змогла обдурити людину, змусивши її пройти за неї стандартну "капчу" "Доведи, що ти не робот".

В одному з розглянутих випадків нейромережа GPT-4 змогла обдурити людину, змусивши її пройти за неї стандартну `капчу` `Доведи, що ти не робот`

Також дослідники побачили, як нейромережа CICERO перемагала людей у настільній грі "Дипломатія", вдаючись до обману. Дослідники виявили, що, граючи за Францію, мовна модель змусила Англію (в її ролі була людина) провести таємні переговори з Німеччиною (іншою людиною). Нейромережа також запропонувала Англії напасти на Німеччину і пообіцяла захист зі свого боку, а потім попередила Німеччину про можливий напад.

Дослідники виявили, що схильність до обману була вищою у більш сучасних і складніших нейромереж. На думку вчених, ці нейромережі краще вміють знаходити ефективні стратегії поведінки, а ті, своєю чергою, часто припускають брехню і удавання.

На думку дослідників, поки зарано говорити, що ШІ спеціально обманює людей. Нейромережа діє виключно в логіці вирішення поставленого завдання, і користується обманом саме як інструментом досягнення потрібного результату.

Проте автори дослідження закликали розробників ШІ звернути увагу на таку поведінку нейромереж. На їхню думку, необхідно розробити систему регулювання ШІ, оскільки його здатність обманювати і маніпулювати може призвести до серйозних наслідків.