Модели искусственного интеллекта испытывают трудности с простым умножением без специальных методов обучения

Модели искусственного интеллекта испытывают трудности с простым умножением без специальных методов обучения

В наши дни большие языковые модели способны справляться со все более сложными задачами, писать сложный код и применять изощренные рассуждения. Но когда дело доходит до умножения четырехзначных чисел, задачи, изучаемой в начальной школе, даже самые современные системы терпят неудачу. Почему? В новой статье, опубликованной на препринт-сервере arXiv аспирантом факультета компьютерных наук Чикагского университета Сяоянем Баем и соруководителем исследовательской инициативы по новым интеллектуальным решениям Института науки о данных Ченхао Таном, ответы находятся путем обратного проектирования неудач и успехов. Они работали в сотрудничестве с коллегами из Массачусетского технологического института, Гарвардского университета, Университета Ватерлоо и Google DeepMind, чтобы исследовать « неровные границы » искусственного интеллекта — термин, обозначающий его способность преуспевать в сложных рассуждениях, но при этом спотыкаться на, казалось бы, простых задачах. Как вы, возможно, помните (или забыли), умножение больших чисел требует переноса цифр и мысленного «удержания» частичных произведений, чтобы затем сложить их и получить итоговую сумму. Процессы, требующие хранения информации для последующего использования таким образом, называются «дальними зависимостями». Стандартные большие языковые модели работают, обучаясь распознавать закономерности в данных, на которых они обучаются. Но чем сложнее задача, тем меньше вероятность того, что модель её конкретно обнаружила. Так как же научит...
31.12.2025 - 18:19
Источник: android-robot.com  
Рубрика: «Наука и Техника»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

Большие языковые модели испытывают трудности с координацией в социальных и кооперативных играхБольшие языковые модели испытывают трудности с координацией в социальных и кооперативных играх Большие языковые модели (LLM), такие как модель, лежащая в основе функционирования популярной диалоговой платформы ChatGPT, в настоящее время широко ...

МТС Web Services на 40% увеличила GPU-мощности для обучения искусственного интеллектаМТС Web Services на 40% увеличила GPU-мощности для обучения искусственного интеллекта МТС Web Services (MWS), входит в группу МТС, сообщает о запуске двух новых кластеров виртуальной инфраструктуры с графическими... ...

Yadro создает собственные серверы для обучения искусственного интеллектаYadro создает собственные серверы для обучения искусственного интеллекта Российский разработчик вычислительного оборудования Yadro работает над созданием высокопроизводительных ИИ-серверов, которые можно использовать для о ...

Спрос на облачные мощности для обучения искусственного интеллекта за год вырос почти в 4 разаСпрос на облачные мощности для обучения искусственного интеллекта за год вырос почти в 4 раза МТС Web Services (MWS), входит в группу МТС, сообщает о том, что закупки виртуальной инфраструктуры с GPU-ускорителями для... ...

Meta* отложила выпуск усовершенствованной модели искусственного интеллекта в ЕСMeta* отложила выпуск усовершенствованной модели искусственного интеллекта в ЕС Компания Meta* (запрещена на территории РФ) Марка Цукерберга не будет выпускать продвинутую версию своей модели искусственного интеллекта в ЕС, объяс ...

Даниил Гаврилов, руководитель лаборатории научных исследований искусственного интеллекта T-Bank AI Research: Почему банки стали центрами разработки иДаниил Гаврилов, руководитель лаборатории научных исследований искусственного интеллекта T-Bank AI Research: Почему банки стали центрами разработки искусственного интеллекта Активными участниками IV Конгресса молодых ученых стали представители науки больших корпораций ...

Александр Гольцов (АМТ-ГРУП): В числе наиболее заметных трендов 2024 года  активное развитие искусственного интеллекта и машинного обученияАлександр Гольцов (АМТ-ГРУП): «В числе наиболее заметных трендов 2024 года — активное развитие искусственного интеллекта и машинного обучения» В 2024 году АМТ-ГРУП завершила разработку и вывела на рынок новую версию аппаратного комплекса однонаправленной передачи данных InfoDiode с пропускно ...

Модели искусственного интеллекта корректируют ответы на тесты на личность, чтобы казаться более приятнымиМодели искусственного интеллекта корректируют ответы на тесты на личность, чтобы казаться более приятными Большинство крупных языковых моделей (LLM) могут быстро определить, когда им предлагают пройти личностный тест, и скорректируют свои ответы, чтобы пр ...

Музеи собирают пошлины // Какие трудности испытывают издатели с использованием изображений музейных экспонатовМузеи собирают пошлины // Какие трудности испытывают издатели с использованием изображений музейных экспонатов Книгоиздатели не могут выпускать сборники о русском искусстве из-за слишком высокой платы за изображение экспонатов. Предложение отменить пошлину и р ...

Оптимизм в отношении искусственного интеллекта ...Оптимизм в отношении искусственного интеллекта ... Искусственный интеллект помог американскому фондовому рынку достичь в этом году ряда исторических максимумов, а компаниям Nvidia Corp., Microsoft Cor ...

DатаРу обновила модельный ряд СХД для искусственного интеллекта«DатаРу» обновила модельный ряд СХД для искусственного интеллекта Российский вендор технологических решений и сервисов «DатаРу» расширил продуктовый портфель базового оборудования... ...

Первый Бит открыл лабораторию искусственного интеллекта«Первый Бит» открыл лабораторию искусственного интеллекта На базе интегратора ИТ-решений «Первый Бит» открылась лаборатория искусственного интеллекта (ИИ) – новое подразделение... ...