Российская визуально-языковая модель обошла решения Google, OpenAI, Anthropic и Alibaba в распознавании русскоязычного текста на изображениях

Российская визуально-языковая модель обошла решения Google, OpenAI, Anthropic и Alibaba в распознавании русскоязычного текста на изображениях

Российская визуально-текстовая модель «Яндекса» Alice AI VLM заняла второе место в лидборде бенчмарка MWS Vision Bench —......

11.01.2026 - 00:19
Источник: www.cnews.ru  
Рубрика: «Игры и Интернет»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

Представлена ИИ-модель YandexART 2.0 с поддержкой генерации текста на изображенияхПредставлена ИИ-модель YandexART 2.0 с поддержкой генерации текста на изображениях «Яндекс» выпустил YandexART 2.0 — генератор картинок нового поколения. Нейросеть научилась создавать надписи на изображении и выдер ...

От текста к симфонии: OpenAI создаёт новую модель генерации музыкиОт текста к симфонии: OpenAI создаёт новую модель генерации музыки По данным источников, технология позволит добавлять музыку к уже существующим видео или, например, автоматически подбирать гитарное сопровождение к в ...

Alibaba представила открытую ИИ-модель, которая лучше OpenAIAlibaba представила открытую ИИ-модель, которая лучше OpenAI Китайская компания Alibaba представила модель искусственного интеллекта с открытым исходным кодом под названием QwQ-32B-Preview. Модель способна реша ...

Доминирование OpenAI на рынке ИИ подходит к концу стараниями Google и AnthropicДоминирование OpenAI на рынке ИИ подходит к концу стараниями Google и Anthropic Спустя три года с момента запуска популярного ИИ-чат-бота ChatGPT стартап OpenAI, чья рыночная стоимость оценивается в $500 млрд, столкнулся со значи ...

Google, OpenAI, xAI и Anthropic получили контракты Пентагона на сумму до $200 млн каждыйGoogle, OpenAI, xAI и Anthropic получили контракты Пентагона на сумму до $200 млн каждый Четыре ведущих разработчика искусственного интеллекта в США получили крупные контракты от Министерства обороны США, направленные на ускорение внедрен ...

Google добавила в чатбота Gemini функцию запоминания прошлых диалогов вслед за OpenAI и AnthropicGoogle добавила в чатбота Gemini функцию запоминания прошлых диалогов вслед за OpenAI и Anthropic Google Gemini теперь запоминает ваши прошлые разговоры для персонализации ответов. Узнайте, как работает новая функция памяти, что такое «Временные ч ...

В KDE переработаны запросы полномочий и реализовано распознавание текста на изображенияхВ KDE переработаны запросы полномочий и реализовано распознавание текста на изображениях Опубликован очередной еженедельный отчёт о разработке KDE. Наиболее заметные изменения, развиваемые для выпуска KDE Plasma 6.6, запланированного на 1 ...

Крошечная рекурсивная ИИ-модель Samsung превзошла в рассуждениях тяжеловесов от Google и OpenAIКрошечная рекурсивная ИИ-модель Samsung превзошла в рассуждениях тяжеловесов от Google и OpenAI Samsung бросила вызов господствующей в отрасли искусственного интеллекта философии «чем больше, тем лучше» и продемонстрировала, что мала ...

Вам шах и мат: российская спортсменка обошла все запреты на национальную символикуВам шах и мат: российская спортсменка обошла все запреты на национальную символику Шахматистка из России Валентина Гунина, выступая на чемпионате мира в Дохе в нейтральном статусе, надела свитер с изображением матрешки. Таким образо ...

OpenAI догнала Anthropic в ИИ-программированииOpenAI догнала Anthropic в ИИ-программировании Ассистент по написанию компьютерного кода OpenAI Codex в ряде задач оказался лучше, чем считающийся первым на рынке Anthropic Claude Code, сообщил ре ...

OpenAI и Anthropic открывают офисы в ЦюрихеOpenAI и Anthropic открывают офисы в Цюрихе Компания OpenAI и ее конкурент в области ИИ Anthropic открыли офисы в Цюрихе, сделав ставку на швейцарский город, где другие технологические гиганты, ...

DeepSeek представила модель сжатия текста через изображенияDeepSeek представила модель сжатия текста через изображения DeepSeek выпустила модель, сжимающую текст через изображения в 10 раз эффективнее. Разработка может расширить контекстные окна ИИ на миллионы токенов ...