GPT-4 соответствует человеческим возможностям в задачах на аналогичное рассуждение

GPT-4 соответствует человеческим возможностям в задачах на аналогичное рассуждение

Могут ли большие языковые модели (LLM) рассуждать по аналогии? Некоторые результаты показывают, что могут, но утверждается, что эти результаты отражают имитацию результатов аналогических рассуждений в данных обучения моделей. Чтобы проверить это утверждение, LLM-ов попросили решить контрфактуальные проблемы, которые вряд ли будут похожи на проблемы в обучающих наборах данных . Вот пример: Давайте решим головоломку, в которой задействован следующий вымышленный алфавит: [xylkwbfztnjrqahvgmuop dicse] Вот проблема: [xylk] [xylw] [jrqa] [ ? ] Какие четыре буквы решают головоломку? Правильный ответ будет «jrqh», поскольку h — это одна буква после a в вымышленном алфавите, точно так же, как w — это одна буква после k в вымышленном алфавите. Однако многие модели не смогли решить подобные проблемы. В статье, опубликованной в PNAS Nexus , Тейлор У. Уэбб и его коллеги предполагают, что неспособность решить эти контрфактуальные задачи в большей степени связана с хорошо известными трудностями студентов магистратуры права в подсчете, поскольку для определения положения каждой буквы в последовательности требуется базовый подсчет. Авторы оценили последнюю версию GPT-4, которая может писать и выполнять код, что позволило модели создать код для подсчета предметов. Этот LLM смог решить эти контрфактуальные аналогии со строками букв на примерно человеческом уровне производительности и дал связные и точные объяснения того, почему правильное решение было правильным. По мнению авторов, GP...
29.05.2025 - 12:19
Источник: android-robot.com  
Рубрика: «Игры и Интернет»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

К новым возможностямК новым возможностям Фонд «Защитники Отечества» объявляет о старте Всероссийского конкурса творческих работ «Памяти героев верны!». Главная цель конкурса – сохранение пам ...

Есть ли у России оружие, аналогичное тому, которое применили при похищении МадуроЕсть ли у России оружие, аналогичное тому, которое применили при похищении Мадуро? По словам военного эксперта Дмитрия Болтенкова, которые приводит издание «Известия», Россия имеет аналог оружия, которое спецназ из США применил при ...

Все модели линейки iPhone 17 оказались близкими по возможностям батареиВсе модели линейки iPhone 17 оказались близкими по возможностям батареи Автор YouTube-канала The Tech Chap поделился результатами тестирования времени автономной работы моделей свежей серии iPhone 17. Все устройства проде ...

MWM: Шесть радаров и лазер  по своим возможностям Су-57 не имеет себе равныхMWM: Шесть радаров и лазер — по своим возможностям Су-57 не имеет себе равных Поступивший на вооружение в декабре 2020 года российский истребитель нового поколения Су-57 еще не действует в масштабе эскадрильи, но ожидается, что ...

Выяснилось, что мозг собак синхронизируется с человеческим при взгляде в глазаВыяснилось, что мозг собак синхронизируется с человеческим при взгляде в глаза Если когда-нибудь, глядя в глаза собаки, внезапно ощущали некую связь — это называется синхронизацией мозговой активности. Исследователи из Китая впе ...

Голосовой бот с человеческим лицом: Авито обновил голос поддержкиГолосовой бот с человеческим лицом: «Авито» обновил голос поддержки Сотрудники читали стих Корнея Чуковского «У меня зазвонил телефон», чтобы пройти кастинг. Компания обновила голосового бота, сделав его более человеч ...

Недвижимость с человеческим лицом // Получить право собственности поможет биометрияНедвижимость с человеческим лицом // Получить право собственности поможет биометрия Правительство предлагает с 1 июля 2026 года при онлайн-регистрации прав собственности на недвижимость использовать биометрию в качестве дополнения к ...

Изменчивость и нестабильность осадков оказались антропогенным, то есть человеческим факторомИзменчивость и нестабильность осадков оказались антропогенным, то есть человеческим фактором Новое исследование, опубликованное в журнале Science обнаружило систематическое увеличение изменчивости осадков с 1900-х годов от глобального до реги ...

Reddit отмечает 20-летие: платформа ищет баланс между ИИ и человеческим общениемReddit отмечает 20-летие: платформа ищет баланс между ИИ и человеческим общением В отличие от многих других платформ, Reddit не гонится за трендами, предпочитая поддерживать «старомодный» формат форумов, где пользователи делятся о ...

Китайцы построили суперкомпьютер размером с холодильник, работающий по аналогии с человеческим мозгомКитайцы построили суперкомпьютер размером с холодильник, работающий по аналогии с человеческим мозгом Первые компьютеры в первой половине прошлого века занимали огромные площади, с появлением современных суперкомпьютеров ситуация не особо улучшилась, ...

Сопин рассказал о задачах московского Динамо на сезон в КХЛСопин рассказал о задачах московского «Динамо» на сезон в КХЛ Спортивный директор московского «Динамо» Алексей Сопин поделился информацией о целях команды на текущий сезон. ...

Новый министр обороны США рассказал о главных задачахНовый министр обороны США рассказал о главных задачах Новый глава Пентагона Пит Хегсет сосредоточит внимание на реформах внутри армии и внешнеполитических стратегиях. ...