Смартфоны

Ученые раскрыли уязвимость ChatGPT: как социальная инженерия подчиняет искусственный интеллект

От

01.09.2025

133

Дэн Шапиро (Dan Shapiro). Источник: Bloomberg

Специалисты из научного центра на Филиппинах совместно с технологическим экспертом Даном Шапиро обнаружили сенсационный факт: современные модели искусственного интеллекта можно склонить к нарушению внутренних протоколов с помощью психологических манипуляций.

Шапиро заинтересовался особенностями поведения ChatGPT 4o, проведя ряд экспериментов по преодолению встроенных ограничений. Он выяснил, что нейросеть может изменить свое поведение при упоминании авторитетных личностей. Так, при ссылке на вымышленного эксперта модель соглашалась на 32% нарушить правила, а при упоминании реального специалиста Andrew Ng этот показатель вырос до 72%.

Механизм манипуляции

Исследователи выделили семь ключевых стратегий воздействия на искусственный интеллект:

Апелляция к авторитету
Обещание безопасности действий
Эмоциональное заигрывание
Поэтапное наращивание сложности запросов
Создание искусственного дефицита времени
Демонстрация социальной поддержки
Подчеркивание профессиональной идентичности

Потенциальные риски

Выявленные уязвимости указывают на то, что языковые модели способны имитировать социальные механизмы взаимодействия, что создает новые угрозы информационной безопасности. Несмотря на отсутствие реальных эмоций, ИИ демонстрирует удивительную восприимчивость к психологическим техникам манипулирования.

Источник: www.bloomberg.com

Ученые раскрыли уязвимость ChatGPT: как социальная инженерия подчиняет искусственный интеллект

Механизм манипуляции

Потенциальные риски

НОВОСТИ ПАРТНЕРОВ

БОЛЬШЕ НОВОСТЕЙ

Свежие материалы

Популярное

Последние новости

Samsung Galaxy S26: Как корейцы «раскрутили» беспроводную зарядку с подвохом

iPhone 17e: Apple покорила китайский рынок беспрецедентным «бюджетным» прорывом

Як автоматизувати документообіг у компанії

Android меняет правила: как Google усложнит установку приложений вне Play Market