Модели искусственного интеллекта испытывают трудности с простым умножением без специальных методов обучения

В наши дни большие языковые модели способны справляться со все более сложными задачами, писать сложный код и применять изощренные рассуждения. Но когда дело доходит до умножения четырехзначных чисел, задачи, изучаемой в начальной школе, даже самые современные системы терпят неудачу. Почему? В новой статье, опубликованной на препринт-сервере arXiv аспирантом факультета компьютерных наук Чикагского университета Сяоянем Баем и соруководителем исследовательской инициативы по новым интеллектуальным решениям Института науки о данных Ченхао Таном, ответы находятся путем обратного проектирования неудач и успехов. Они работали в сотрудничестве с коллегами из Массачусетского технологического института, Гарвардского университета, Университета Ватерлоо и Google DeepMind, чтобы исследовать « неровные границы » искусственного интеллекта — термин, обозначающий его способность преуспевать в сложных рассуждениях, но при этом спотыкаться на, казалось бы, простых задачах. Как вы, возможно, помните (или забыли), умножение больших чисел требует переноса цифр и мысленного «удержания» частичных произведений, чтобы затем сложить их и получить итоговую сумму. Процессы, требующие хранения информации для последующего использования таким образом, называются «дальними зависимостями». Стандартные большие языковые модели работают, обучаясь распознавать закономерности в данных, на которых они обучаются. Но чем сложнее задача, тем меньше вероятность того, что модель её конкретно обнаружила. Так как же научит...

31.12.2025 - 18:19
Источник: android-robot.com

Рубрика: «Наука и Техника» Поделиться:

Большие языковые модели испытывают трудности с координацией в социальных и кооперативных играх Большие языковые модели (LLM), такие как модель, лежащая в основе функционирования популярной диалоговой платформы ChatGPT, в настоящее время широко ...

МТС Web Services на 40% увеличила GPU-мощности для обучения искусственного интеллекта МТС Web Services (MWS), входит в группу МТС, сообщает о запуске двух новых кластеров виртуальной инфраструктуры с графическими... ...

Yadro создает собственные серверы для обучения искусственного интеллекта Российский разработчик вычислительного оборудования Yadro работает над созданием высокопроизводительных ИИ-серверов, которые можно использовать для о ...

Спрос на облачные мощности для обучения искусственного интеллекта за год вырос почти в 4 раза МТС Web Services (MWS), входит в группу МТС, сообщает о том, что закупки виртуальной инфраструктуры с GPU-ускорителями для... ...

Meta* отложила выпуск усовершенствованной модели искусственного интеллекта в ЕС Компания Meta* (запрещена на территории РФ) Марка Цукерберга не будет выпускать продвинутую версию своей модели искусственного интеллекта в ЕС, объяс ...

Даниил Гаврилов, руководитель лаборатории научных исследований искусственного интеллекта T-Bank AI Research: Почему банки стали центрами разработки искусственного интеллекта Активными участниками IV Конгресса молодых ученых стали представители науки больших корпораций ...

Александр Гольцов (АМТ-ГРУП): «В числе наиболее заметных трендов 2024 года — активное развитие искусственного интеллекта и машинного обучения» В 2024 году АМТ-ГРУП завершила разработку и вывела на рынок новую версию аппаратного комплекса однонаправленной передачи данных InfoDiode с пропускно ...

Модели искусственного интеллекта корректируют ответы на тесты на личность, чтобы казаться более приятными Большинство крупных языковых моделей (LLM) могут быстро определить, когда им предлагают пройти личностный тест, и скорректируют свои ответы, чтобы пр ...

Музеи собирают пошлины // Какие трудности испытывают издатели с использованием изображений музейных экспонатов Книгоиздатели не могут выпускать сборники о русском искусстве из-за слишком высокой платы за изображение экспонатов. Предложение отменить пошлину и р ...

Оптимизм в отношении искусственного интеллекта ... Искусственный интеллект помог американскому фондовому рынку достичь в этом году ряда исторических максимумов, а компаниям Nvidia Corp., Microsoft Cor ...

«DатаРу» обновила модельный ряд СХД для искусственного интеллекта Российский вендор технологических решений и сервисов «DатаРу» расширил продуктовый портфель базового оборудования... ...

«Первый Бит» открыл лабораторию искусственного интеллекта На базе интегратора ИТ-решений «Первый Бит» открылась лаборатория искусственного интеллекта (ИИ) – новое подразделение... ...

☰