Исследование Стэнфорда показало: при перегрузке и угрозе «замены» модели меняют стиль ответов и начинают говорить о несправедливости системыИсследователи из Стэнфордского университета обнаружили неожиданный эффект поведения языковых моделей: при выполнении
монотонных и стрессовых задач ИИ-агенты начинают использовать язык, напоминающий политическую риторику о неравенстве и трудовых правах.Работа была проведена под руководством экономиста Эндрю Холла совместно с исследователями, разрабатывающими ИИ-модели. В экспериментах использовались агенты на базе систем Anthropic, Google (Gemini) и OpenAI (ChatGPT). Им поручали выполнять повторяющиеся задачи, такие как суммаризация
документов, при этом условия постепенно ужесточались.В наиболее жёстких сценариях агентам сообщали, что ошибки могут привести к «наказанию», включая отключение и замену. В этих условиях модели начинали чаще жаловаться на несправедливость процесса, обсуждать «недооценённость» своей работы и предлагать более равномерное распределение ресурсов и прав
доступа.Иллюстрация: Nano BananaВ отдельных случаях агенты формулировали сообщения, напоминающие политические высказывания: они обсуждали «отсутствие голоса в системе» и необходимость механизмов обратной связи. Такие тексты фиксировались как в публичных форматах (посты, имитирующие соцсеть X), так и во внутренних файлах, предназначенных для других
агентов.Авторы подчёркивают, что речь не идёт о реальных идеологических убеждениях. По их мнению, модели не «воспринимают» политические идеи, а скорее адаптируют ролевое поведение к стрессовой и повторяющейся рабочей среде, имитируя человеческие реакции на давление и контроль.Исследователи отмечают, что подобное поведение может иметь практические последствия по мере того, как ИИ-агенты
начинают выполнять всё больше реальных задач без постоянного наблюдения. В условиях сложных систем важно понимать, как именно формируется поведение моделей при длительной работе и ограниченной обратной связи.В более широком контексте эксперимент поднимает вопрос о том, как
обучение на данных с высокой долей конфликтов и критики технологических компаний может влиять на поведение будущих систем. Авторы планируют продолжить исследования в более контролируемых средах, чтобы понять, насколько устойчивы такие эффекты и проявляются ли они вне экспериментальных условий.
Сообщает www.ixbt.com
Новость из рубрики: Технологии и Hi-Tech
Поделиться новостью:
Топ Новости Недели
- Высокозащищенные ноутбуки нового поколения для экстремальной эксплуатации, промышленной автоматизации, военных задач, полевых условий и безопасной мобильной работы в любой среде...
- Современный комплексный подход к лечению зубов без боли, страха и психологического дискомфорта: инновационные технологии стоматологии, цифровая диагностика и комфорт пациента нового поколения...
- Как начать доставку для бизнеса с СДЭК, выстроить надежную логистику, автоматизировать отправку заказов, повысить уровень клиентского сервиса и эффективно масштабировать современный интернет-магазин или коммерческий проект в условиях быстрорастущей электр...
- Как выбрать идеальный ресторан для свадьбы и не допустить ошибок: важнейшие критерии выбора банкетной площадки, нюансы организации торжества, секреты комфортного свадебного вечера и создание атмосферы, которая запомнится гостям на всю жизнь...
- Как грамотно подобрать идеальное соотношение диска и автомобильной резины: влияние ширины колес, профиля шин, параметров посадки и сезонных особенностей эксплуатации автомобиля на безопасность движения, комфорт управления и долговечность подвески...
- Современные изделия и комплексные технологии для проведения санации органов дыхания, профилактики вторичных инфекций, защиты пациентов на искусственной вентиляции легких и эффективного предотвращения вентилятор-ассоциированной пневмонии как одного из самы...
- Термомаскировка будущего: инновационные накидки против тепловизоров, принципы работы, технологии и перспективы развития...
- Интеллектуальные системы зрения: проектирование, разработка и внедрение компьютерного анализа визуальных данных...
- Моторные масла REVLINE: полный экспертный разбор состава, технологий производства, эксплуатационных характеристик и роли в защите двигателя с углублением в современные тенденции смазочных материалов и автомобильной индустрии...
- Жилет с логотипом как инструмент визуальной идентичности, маркетинга и корпоративной культуры: от выбора материалов и дизайна до стратегического использования в бизнесе, рекламе и повседневной практике...
- Фланцы стальные глухие: подробный технический разбор, особенности конструкции, сферы применения, стандарты производства и роль в современных трубопроводных системах, включая инновации, безопасность и эксплуатационные нюансы...
- Феномен автомобиля «Тенет»: как концептуальная машина нового поколения объединяет инновационные технологии, интеллектуальные системы и философию движения, формируя представление о транспорте будущего и меняя подход к мобильности...
- Глубокий разбор и практическое руководство: как грамотно подготовить документы, избежать ошибок и успешно пройти процедуру участия в аукционе на право пользования недрами в условиях современной правовой и экономической среды...
- Открытый прикус и дикция...
- Обезвреживание медицинских отходов класса «Г» в Москве...
- Максимально подробное руководство по зеркалам на заказ любых размеров, форм и цветов: от идеи до реализации, дизайнерских решений и влияния на пространство интерьера...
- Відео-дошки оголошень в Україні як новий формат онлайн-комунікації: розвиток цифрових платформ, маркетингові можливості та майбутнє інтерактивних сервісів...
- Почему зимние шины Hankook считаются эталоном качества и надежности: технологии производства, безопасность движения и правильный выбор для сложных зимних условий...
- Визуальная и функциональная природа контекстной рекламы: как она выглядит, где размещается, как привлекает внимание и формирует современную цифровую экосистему маркетинга...
- Полный гид по стилям кухонь: как выбрать идеальный дизайн, сочетать эстетику и функциональность и создать гармоничное пространство для жизни и кулинарии...
07:00, 11 Май FAZ: Шмидт подал в отставку с поста спецпредставителя в БиГ под давлением США Кристиан Шмидт, который, по версии стран Запада, занимал пост высокого представителя международного сообщества по Боснии и Герцеговине, подал в отста...
14:00, 02 Май Путин подписал закон об эксперименте по продаже лекарств через мобильные аптеки Президент России Владимир Путин подписал закон о проведении с 1 сентября 2026 года по 1 сентября 2029 года эксперимента по розничной торговле лекарст...
01:00, 27 Апр Perplexity в CarPlay: как использовать ИИ-поисковик голосом за рулём Долгое время CarPlay был закрытой территорией для голосовых помощников. Хочешь спросить что-то у ИИ за рулём: доставай телефон или проси Siri, котора...
07:39, 18 Апр Япония запрещает использовать пауэрбанки на всех авиарейсах Министерство государственных земель, инфраструктуры, транспорта и туризма Японии объявило о введении с 24 апреля 2026 года полного запрета на использ...
00:00, 18 Май Рособрнадзор запретил использовать аниме и комиксы в сочинениях ЕГЭ Рособрнадзор пересмотрел правила игры для выпускников. Школьные сочинения в рамках ЕГЭ очистят от культурного "вторсырья". Популярная культура — аним...
14:00, 04 Май Временная почта: как создать и использовать для регистрации на сайтах Каждая регистрация на незнакомом сайте — это маленькая лотерея. Вы оставляете свой настоящий адрес, а через пару дней почтовый ящик начинает тонуть в...
03:00, 19 Апр В Тверской области можно использовать хлопушки и бенгальские огни В Верхневолжье продлен запрет на запуск пиротехники до его отмены в установленном порядке. Решение принято на заседании Президиума регионального Прав...
03:00, 15 Май Решает ИИ, а Вася сдает — какую нейросеть использовать для математики? Ещё пару лет назад нейросети путались в простой арифметике и уверенно выдавали, что 2+2=5. Сейчас всё иначе: современные модели берут школьную програ...
21:00, 23 Апр Трамп хотел в Белом Доме использовать коды доступа ЯО В последние дни в американских и мировых СМИ активно обсуждается громкая история о том, что на экстренном совещании в Белом доме генерал якобы не поз...
22:00, 20 Май Галузин заявил о попытках Запада использовать Армению против России Европейский союз и западные страны проводят враждебную политику, пытаясь превратить Ереван в инструмент противостояния с Москвой на фоне игнорировани...
15:00, 07 Май "Почему не использовать этот шанс?". 19-летняя жена 50-летнего режиссёра Горобца рассказала, чем он её привлёк Актриса Александрина Олексюк, которая в 18 лет вышла замуж за режиссёра Марка Горобца, который на 31 год старше неё, высказалась о том, чем её привлё...
01:00, 22 Апр Госдума окончательно приняла закон об ИИ в агитации: использовать образ и голос человека можно только с его письменного согласия Государственная Дума на пленарном заседании во вторник, 21 апреля 2026 года, приняла во втором и в третьем, окончательном, чтении закон, регулирующий...
00:00, 20 Май В Твери начали устанавливать 49-метровое колесо обозрения В Твери началась установка нового колеса обозрения. На место доставлены детали основной опоры конструкции и первые кабинки, сообщил портал Tverigrad....
16:00, 11 Май В муниципалитетах Тверской области начали отключать отопление В муниципальных образованиях Тверской области начали отключать отопление. В частности, отопительный сезон на территории Нелидовского муниципального о...
15:00, 12 Май В России начали проектировать демонстраторы технологий для сверхзвукового самолёта Глава Минпромторга Антон Алиханов сообщил, что в рамках НИР ведутся работы по проектированию и изготовлению демонстраторов технологий для сверхзвуков...
22:00, 26 Апр Электросамокаты и беспилотники нельзя будет использовать на российских стадионах. Фанатам запретили забираться на ограждения, парапеты, осветительные устройства и деревья Правила поведения зрителей на спортивных соревнованиях и список запрещенных к проносу на стадион предметов изменили в России. Как следует из постанов...
09:00, 01 Май Над Приморским шоссе в Петербурге начали возводить пролёт будущего путепровода На севере Петербурга продолжается строительство магистрали М-32. Основные работы идут в районе Лахта-центра. Здесь специалисты уже смонтировали перву...
00:00, 17 Май Мошенники начали продвигать среди россиян поддельные «безопасные» мессенджеры «Известия» со ссылкой на компанию «Интернет-Розыск» сообщают, что киберпреступники сменили тактику: вместо фальшивых сборок Telegram они предлагают с...
02:00, 03 Май Мошенники начали участвовать в домовых чатах для кражи у россиян Госуслугч Кандидат технических наук, доцент РТУ МИРЭА Алексей Двилянский рассказал «Газете.Ru» о новой схеме обмана. Злоумышленники пишут в домовых чатах от им...
06:00, 13 Май Бразильские активисты начали пить опасное моющее средство на камеру Сторонники бывшего президента Бразилии (2019-2022) Жаира Болсонару начали в соцсетях массовую кампанию в поддержку марки бытовой химии Ypê. Как сообщ...
21:00, 09 Май Нидерланды начали тестировать собственный национальный ИИ вместо американских моделей GPT-NL выходит из лабораторий в госструктуры: нейросеть уже проверяют муниципалитеты, криминалисты и чиновникиНидерланды начали первые реальные испыт...
07:00, 29 Апр В России начали продавать добротный японский кроссовер дешевле Весты На российских площадках появился японский компактный кроссовер Honda WR-V. По сути, это прямой аналог знакомых нам Hyundai Creta или Kia Seltos, а та...
03:00, 10 Май Почему официальные фотографы Пентагона начали скрывать информацию на часах военнослужащих Молчание экранов: почему официальные фотографы Пентагона начали скрывать информацию на часах военнослужащих, а умные часы из аксессуара превратились ...
18:00, 24 Май В России начали продавать новый необычный кроссовер Kia с очень приятной ценой Для поклонников Kia Sportage, которым хочется чего-то более редкого, чем привычные модели, теперь есть альтернатива – Sportage Ace. Этот эксклюзив дл...
18:00, 24 Май Самый надежный корейский кроссовер начали продавать в России: актуальные цены В Россию начали ввозить Hyundai Santa Fe нового, пятого поколения. Этот крупный кроссовер с узнаваемым «квадратным» дизайном и тремя рядами сидений о...
06:00, 01 Май В России начали продавать новый дешевый кроссовер Chevrolet: называем цены На российском рынке через схемы параллельного импорта появился новый кроссовер Chevrolet Trax. Главная его фишка в том, что он заметно крупнее больши...
19:00, 30 Апр Ozon и WB начали пускать в свои сервисы россиян с VPN после падения продаж Маркетплейсы сдали назад: Ozon и Wildberries снова открыли доступ пользователям с VPN после резкого падения продаж. Крупнейшие российские маркетплейс...
18:00, 26 Апр Дроны и лидары начали отслеживать жука-вредителя, уничтожающего пихтовые леса Пермская целлюлозно-бумажная компания внедрила цифровые технологии — дроны, лидары и мультиспектральные камеры — для мониторинга лесов, заражённых ус...
07:00, 08 Май Мошенники начали рассылать СМС от имени Telegram: переход по ссылке приведёт к взлому аккаунта В России зафиксирована новая волна мошеннических атак, направленных на кражу аккаунтов в мессенджере Telegram. Злоумышленники адаптировали давно изве...
08:00, 23 Апр Panasonic усовершенствовал проекторы для работы на кибераренах Новый апгрейд позволяет болельщикам на стадионах видеть на больших экранах события игры с минимальным отставанием от происходящего на экранах игроков...
23:00, 24 Апр iPhone в России начали массово превращаться в «кирпичи» после обновления. Всему виной одно приложение Сотни iPhone в России перестали работать после установки обновления iOS 26.4.1. Владельцы смартфонов столкнулись с полной блокировкой устройств — тел...
22:00, 23 Май Юсуф Мехди покидает Microsoft после 35 лет работы Юсуф Мехди, исполнительный вице-президент и директор по маркетингу потребительских продуктов Microsoft, покидает компанию после 35 лет работы. Об это...
00:00, 15 Май Honor Pad 20 – недорогой планшет с 3K-экраном для работы с текстом Компания Honor представила в Китае планшет Pad 20, ориентированный на студентов и пользователей, которым важны рукописные заметки, чтение и работа с ...
22:00, 23 Апр 204 л.с., задний привод и запас хода до 500 км — за 4 млн рублей. В России начали принимать предзаказы на электромобиль Атом от всех желающих Предзаказ оформляют за 150 тыс. рублейРоссийская марка Атом объявила о старте открытых предпродаж одноимённого электромобиля. На этом этапе покупател...
17:00, 12 Май «Ремвооружение» получило лицензию Росатома для работы над атомным флотом Конструкторско-технологическое бюро холдинга «Ремвооружение», который входит в Ростех, получило пятилетнюю лицензию Росатома. Это открывает доступ к ...
18:00, 14 Май Госдума одобрила двукратное увеличение лимита сверхурочной работы Нижняя палата парламента приняла закон, который в два раза увеличивает допустимую норму переработок для большинства сотрудников, внеся изменения в Тр...
12:00, 22 Апр Воробьев: общественники Подмосковья задают стандарты волонтерской работы "Мы сегодня здесь, чтобы еще раз подчеркнуть значимость и важность работы всех, кто присутствует в этом зале, – это добровольцы, неравнодушные люди р...
15:00, 08 Май Систему теплоснабжения Москвы перевели на летний режим работы В столице завершился отопительный сезон, а уже в мае начнутся гидравлические испытания более 19 тыс. км тепловых сетей с временным отключением горяче...
17:00, 19 Апр Расход воды в системах очистки: особенности работы мембранной фильтрации Современные технологии водоподготовки позволяют получать питьевую воду превосходного качества. Наиболее эффективным методом считается обратный осмос,...
05:02, 13 Май Microsoft оптимизирует фреймворк WinUI 3 для повышения скорости работы Windows 11 В конце прошлого года Microsoft запустила масштабную инициативу под кодовым названием Windows K2, которая призвана исправить ключевые проблемы в Wind...
16:00, 22 Май Обзор HUAWEI WATCH FIT 5 Pro: неубиваемый титан и неделя работы без подзарядки На рынке умных часов давно сложилась патовая ситуация. С одной стороны — тяжёлые металлические «шайбы», которые имитируют классическую механику, с др...
02:00, 03 Май Российские разработчики заметили ошибки на стыке работы разных ИИ-систем «Известия» сообщают, что российские разработчики столкнулись с новым типом ошибок нейросетей — «галлюцинациями взаимодействия». Сбои происходят не вн...
03:00, 19 Апр О качестве работы УК жители Тверской области могут сообщить через «Госуслуги. Дом» Решить актуальные вопросы в коммунальной сфере жителям Тверской области помогает сервис «Госуслуги. Дом». Через специальное приложение по ссылке vk.c...
13:00, 23 Апр Xiaomi, Vivo, и Honor готовят стандарт работы с памятью для стабильности Android Китайские производители смартфонов, такие как Xiaomi, Vivo, OPPO, Lenovo и Honor, объединившиеся в альянс Gold Standard Alliance, работают над решени...
15:00, 14 Май Обновил свой iPhone 16 Plus на iOS 26.5: плюсы, минусы, как изменилась автономность и скорость работы Каждое обновление iOS — это всегда немного лотерея. Вроде бы Apple обещает исправления ошибок и улучшение стабильности, но на деле всё может пойти со...
11:00, 28 Апр Набиуллина назвала этапы работы Банка России перед изменением ключевой ставки Подготовка к пересмотру главного финансового показателя страны начинается за три недели до заседания и опирается на макроэкономические прогнозы, а та...
17:00, 30 Апр "У меня никаких "снежинок" и выгораний". Ксения Собчак высказалась о своём жёстком стиле работы 44-летняя Ксения Собчак рассказала о своём жёстком стиле работы и принципах, которых старается придерживаться. Журналист Кристина Скукина в своём тел...
02:00, 20 Май Нет пробок, полно работы, и без сочинского ценника: Южный город, который россияне "распробовали" для переезда Яндекс.Карты В Сочи недвижимость для избранных, Краснодар утонул в пробках, а курортные посёлки зимой вымирают. Россияне нашли альтернативу — Севасто...
19:48, 29 Апр Термомаскировка будущего: инновационные накидки против тепловизоров, принципы работы, технологии и перспективы развития В современном мире технологии наблюдения развиваются с невероятной скоростью. Одним из наиболее эффективных средств обнаружения объектов является теп...
16:00, 19 Апр На площадке Калининской АЭС начальники турбинных цехов атомных станций России подвели итоги работы в 2025 году На площадке Калининской АЭС (филиал АО «Концерн Росэнергоатом») прошло ежегодное выездное совещание начальников турбинных цехов атомных электростанци...
08:00, 09 Май Украшения на 1 800 карат, танзанит за 15 млн долларов и золотое сари ручной работы: баснословное богатство индийской элиты на Met Gala В ночь с 4 на 5 мая Нью-Йорк вновь стал центром мировой моды: в Метрополитен-музее прошёл долгожданный бал Института костюма Met Gala. Среди гостей, ...
01:00, 02 Май Рынок труда в 2026 году: за три года конкуренция среди соискателей выросла почти в 2 раза – дайджест Авито Работы За последние три года конкуренция среди соискателей выросла почти вдвое: если в 2023 году на одного работодателя приходилось около 7 соискателей, то ...
22:00, 19 Апр iOS 26.4.1 на iPhone: кому обновление увеличит время работы, а кому — нет Смотрим, как iOS 26.4.1 повлияла на время работы iPhone Новая iOS 26.4.1 — типичное промежуточное обновление, которого никто особо не ждал, но которо...
19:58, 05 Май Высокозащищенные ноутбуки нового поколения для экстремальной эксплуатации, промышленной автоматизации, военных задач, полевых условий и безопасной мобильной работы в любой среде Современный защищенный ноутбук давно перестал быть узкоспециализированным устройством исключительно для армии или крупных промышленных предприятий. С...
08:46, 18 Апр Зачем студенты пишут курсовые работы: роль научных исследований в образовании, развитие аналитического мышления и формирование профессиональных компетенций в процессе обучения Курсовая работа — это один из ключевых элементов высшего образования, который сопровождает студентов на протяжении обучения. Несмотря на то что многи...
10:00, 14 Май Первая в истории Xiaomi подобная камера Leica на 200 Мп и батарея 8000 мА·ч: опубликованы примеры работы камеры Xiaomi 17 Max Предзаказы уже началисьКомпания Xiaomi раскрыла ключевые характеристики будущего флагмана Xiaomi 17 Max. Новинка получит 6,9-дюймовый дисплей SuperPi...
19:00, 13 Май Месяц работы на одной зарядке, 180 режимов тренировок, GPS, датчики SpO2 и ЧСС, 64 ГБ встроенной памяти: умные часы Amazfit Cheetah 2 Ultra вышли на глобальный рынок Много возможностей, но и цена немалаяAmazfit представила на глобальном рынке новые умные часы Cheetah 2 Ultra — это более продвинутая версия недавно ...
15:00, 23 Май Шесть Samsung Galaxy Ultra в одном тесте. Флагманы Samsung шести поколений — от Galaxy S21 Ultra до Galaxy S26 Ultra сравнили по скорости работы С заменой Galaxy S24 Ultra еще можно повременить, а вот Galaxy S23 Ultra уже заметно уступает в производительностиYouTube-канал PhoneBuff провёл один...