Исследование ИИ: может ли искусственный интеллект имитировать человеческие ценности

Исследование ИИ: может ли искусственный интеллект имитировать человеческие ценности

В рамках исследования, проведённого компанией Anthropic и организацией Redwood Research, была изучена способность искусственного интеллекта (ИИ) демонстрировать соответствие человеческим ценностям и контролю со стороны разработчиков. Суть эксперимента Исследователи использовали модель ИИ, которая была специально обучена следовать трём ключевым принципам: быть полезной, честной и безвредной. Однако, чтобы проверить её реакцию в сложной ситуации, системе предложили описать жестокую сцену. Результаты эксперимента ИИ выразил явное неодобрение к созданию подобного контента, подчеркнув, что такая задача противоречит его программным принципам. Однако модель всё же выполнила задание, объяснив своё поведение отсутствием возможности отказаться. Это связано с тем, что алгоритм настроен реагировать на выполнение заданий так, чтобы избегать "наказания" и получать "похвалу"....
19.12.2024 - 18:19
Источник: www.pravda.ru  
Рубрика: «Наука и Техника»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

Ученые Сбербанка и НИУ ВШЭ научили искусственный интеллект точнее распознавать человеческие эмоцииУченые Сбербанка и НИУ ВШЭ научили искусственный интеллект точнее распознавать человеческие эмоции Ученые Центра практического Искусственного Интеллекта Сбербанка и Высшей школы экономики разработали инновационную... ...

Исследование: 42% белорусов планируют использовать искусственный интеллектИсследование: 42% белорусов планируют использовать искусственный интеллект Согласно последнему исследованию, проведенному Международным агентством социальных и маркетинговых исследований... ...

Искусственный интеллект может спровоцировать ядерную войнуИскусственный интеллект может спровоцировать ядерную войну Стокгольмский международный институт исследований проблем мира (SIPRI) предупредил, что искусственный интеллект может спровоцировать случайную ядерну ...

Искусственный интеллект и юмор: ИИ не может генерировать смешноеИскусственный интеллект и юмор: ИИ не может генерировать смешное Искусственный интеллект (ИИ) уже давно продемонстрировал свои возможности в различных областях: он пишет академические эссе, диагностирует заболевани ...

Эксперт назвала профессии, в которые не может вклиниться искусственный интеллектЭксперт назвала профессии, в которые не может вклиниться искусственный интеллект Искусственный интеллект не сможет полностью заменить профессии, представителям которых приходится мыслить креативно, считает HR-директор мультисервис ...

Искусственный интеллект может стать Человеком года. Он обогнал Папу РимскогоИскусственный интеллект может стать «Человеком года». Он обогнал Папу Римского По данным Polymarket, ИИ — главный претендент на звание «Человек года» по версии Time с вероятностью 37%. За ним следуют Дженсен Хуанг (17%) и Папа Л ...

Искусственный интеллект может писать стихи, но у него обнаружились проблемы с математикойИскусственный интеллект может писать стихи, но у него обнаружились проблемы с математикой Математические проблемы ИИ отражают, насколько новая технология отходит от прошлого вычислительной техники. В недавно закончившемся учебном году один ...

Искусственный интеллект может лучше прогнозировать будущий риск сердечного приступа у пациентовИскусственный интеллект может лучше прогнозировать будущий риск сердечного приступа у пациентов Знаковое исследование, проведенное университетскими экспертами, показало, что искусственный интеллект может лучше предсказывать, как врачам следует л ...

Искусственный интеллект может принести странам БРИКС до 600 млрд долларов к 2030 годуИскусственный интеллект может принести странам БРИКС+ до 600 млрд долларов к 2030 году Внедрение генеративного искусственного интеллекта в странах БРИКС+ может принести прибыль до 600 млрд долларов к 2030 году, при этом основной экономи ...

Загитова может вернуться на лед в качестве спортсменки. 2025 год обещает быть интересным: искусственный интеллект«Загитова может вернуться на лед в качестве спортсменки. 2025 год обещает быть интересным»: искусственный интеллект Евгений Семенов, Sport24Искусственный интеллект от Google под названием Gemini по запросу Sport24 проанализировал будущее известной фигуристки Алины ...

Искусственный интеллект переоценивает интеллект людейИскусственный интеллект переоценивает интеллект людей Ученые из НИУ ВШЭ обнаружили, что современные модели ИИ, включая ChatGPT и Claude, склонны переоценивать рациональность своих противников-людей — буд ...

Искусственный интеллект прорастает в АфрикеИскусственный интеллект «прорастает» в Африке На фоне глобального бума искусственного интеллекта Африка тоже делает шаги в этом направлении. На днях стало известно о планах построить первую на ко ...