Inception Labs представила Mercury – первую диффузионную языковую модель

Inception Labs представила Mercury – первую диффузионную языковую модель

В четверг компания Inception Labs выпустила Mercury Coder – новую языковую модель ИИ, которая использует методы диффузии для генерации текста быстрее, чем обычные модели. В отличие от традиционных моделей, которые создают текст слово за словом (например ChatGPT), основанные на диффузии модели, такие как Mercury, одновременно производят целые ответы, преобразуя их из изначально замаскированного состояния в связный текст.Традиционные большие языковые модели строят текст слева направо, по одному токену за раз. Они используют технику, называемую «авторегрессия». Каждое слово должно ждать всех предыдущих слов, прежде чем появиться. Вдохновленные техниками из моделей генерации изображений, таких как Stable Diffusion, DALL-E и Midjourney, языковые модели диффузии текста, такие как LLaDA (разработанные исследователями из Университета Жэньминь и Ant Group) и Mercury, используют подход, основанный на маскировании. Эти модели начинают с полностью скрытого контента и постепенно раскрывают все части ответа одновременно.Согласно Inception Labs, их подход позволяет модели уточнять выходные данные и устранять ошибки, поскольку она не ограничивается рассмотрением только ранее сгенерированного текста. Эта параллельная обработка обеспечивает заявленную Mercury скорость генерации более 1000 токенов в секунду на графических процессорах NVIDIA H100. Эти модели диффузии поддерживают производительность быстрее или сопоставимую с обычными моделями аналогичного размера. Исследователи LLaDA сообщают, ч...
02.03.2025 - 18:19
Источник: mobidevices.com  
Рубрика: «Гаджеты»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

OpenAI представила думающую языковую модель o1OpenAI представила думающую языковую модель o1 Компания OpenAI представила новую языковую модель o1, обладающую способностью к рассуждению и логически решать задачи. В отличие от предыдущих моделе ...

Microsoft представила малую языковую модель Mu для ИИ-агента в Параметрах WindowsMicrosoft представила малую языковую модель «Mu» для ИИ-агента в «Параметрах» Windows Microsoft представила новую малую языковую модель под названием «Mu», которая обеспечивает работу ИИ-агента в приложении «Параметры» в Windows 11. Мо ...

Microsoft представила малую языковую модель Phi-4-mini-flash-reasoningMicrosoft представила малую языковую модель Phi-4-mini-flash-reasoning Microsoft выпустила новую малую языковую модель под названием Phi-4-mini-flash-reasoning, главное преимущество которой заключается в расширенных возм ...

Topaz Labs представила диффузную ИИ-модель, которая автоматически улучшает старые видеоTopaz Labs представила диффузную ИИ-модель, которая автоматически улучшает старые видео Компания Topaz Labs, специализирующая на разработке программного обеспечения для редактирования фотографий и видео, представила модель ИИ Project Sta ...

Стартап Inception представил ИИ-модель, которая в 10 раз быстрее ChatGPTСтартап Inception представил ИИ-модель, которая в 10 раз быстрее ChatGPT Компания Inception из города Пало-Альто вышла из «режима скрытой разработки» (stealth) и представила нейросеть Mercury на совершенно новой архитектур ...

Группа компаний ТИОН представила первую модель кондиционера TION EdelweissГруппа компаний ТИОН представила первую модель кондиционера TION Edelweiss Кондиционер выполнен в минималистичном стиле с матовым корпусом. Внутренний блок имеет функцию самоочистки, который помогает ему избавляться от пыли, ...

Ноутбук Inferit Mercury 15,6 на базе Intel Core i5-1334U: модель для бизнеса с ОС МСВСфераНоутбук Inferit Mercury 15,6″ на базе Intel Core i5-1334U: модель для бизнеса с ОС «МСВСфера» Эту модель отличают привлекательный внешний вид, надежный металлический корпус, наличие адаптера проводной локальной сети, удобная эргономичная клави ...

Проект OpenGPT-X выпускает большую языковую модельПроект OpenGPT-X выпускает большую языковую модель Большая языковая модель исследовательского проекта OpenGPT-X теперь доступна для загрузки на Hugging Face: «Teuken-7B» обучена с нуля на всех 24 офиц ...

Mistral AI опубликовал Devstral, большую языковую модель для работы с кодомMistral AI опубликовал Devstral, большую языковую модель для работы с кодом Компания Mistral AI представила большую языковую модель Devstral, оптимизированную для решения проблем, возникающих в процессе разработки ПО. В отлич ...

Google использовал большую языковую модель для выявления уязвимости в SQLiteGoogle использовал большую языковую модель для выявления уязвимости в SQLite Исследователи из подразделений Google Project Zero и Google DeepMind опубликовали отчёт о развитии AI-системы Big Sleep, построенной на базе большой ...

Яндекс встроил в Алису свою самую мощную языковую модель«Яндекс» встроил в «Алису» свою самую мощную языковую модель «Яндекс» обновил опцию «Алиса Про», предоставив пользователям доступ к своей самой новой и мощной языковой модели... ...

Z.ai выпустила большую языковую модель с открытым исходным кодом GLM-4.7, созданную для реальных рабочих процессов разработкиZ.ai выпустила большую языковую модель с открытым исходным кодом GLM-4.7, созданную для реальных рабочих процессов разработки В преддверии Рождества Z.ai выпустила версию GLM-4.7, которая является последней... Сообщение Z.ai выпустила большую языковую модель с открытым исход ...