NVIDIA анонсировала ИИ-модели Llama Nemotron с регулируемым «уровнем интеллекта» для создания продвинутых ИИ-агентов, работающих независимо или с минимальным контролем в составе связанных команд

NVIDIA анонсировала новое семейство ИИ-моделей Llama Nemotron с расширенными возможностями рассуждения. Основанные на моделях Llama с открытым исходным кодом от Meta✴ Platforms, модели от NVIDIA предназначены для предоставления разработчикам основы для создания продвинутых ИИ-агентов, которые могут от имени своих пользователей независимо или с минимальным контролем работать в составе связанных команд для решения сложных задач.
«Агенты — это автономные программные системы, предназначенные для рассуждений, планирования, действий и критики своей работы», — сообщила Кари Бриски (Kari Briski), вице-президент по управлению программными продуктами Generative AI в NVIDIA на брифинге с прессой, пишет VentureBeat. «Как и люди, агенты должны понимать контекст, чтобы разбивать сложные запросы, понимать намерения пользователя и адаптироваться в реальном времени», — добавила она. По словам Бриски, взяв Llama за основу, NVIDIA оптимизировала модель с точки зрения требований к вычислениям, сохранив точность ответов.
источник: 3dnews.ru
NVIDIA сообщила, что улучшила новое семейство моделей рассуждений в ходе дообучения, чтобы улучшить многошаговые математические расчёты, кодирование, рассуждения и принятие сложных решений. Это позволило повысить точность ответов моделей до 20 % по сравнению с базовой моделью и увеличить скорость инференса в пять раз по сравнению с другими ведущими рассуждающими open source моделями. Повышение производительности инференса означают, что модели могут справляться с более сложными задачами рассуждений, имеют расширенные возможности принятия решений и позволяют сократить эксплуатационные расходы для предприятий, пояснила компания.
Модели Llama Nemotron доступны в микросервисах NVIDIA NIM в версиях Nano, Super и Ultra. Они оптимизированы для разных вариантов развёртывания: Nano для ПК и периферийных устройств с сохранением высокой точности рассуждения, Super для оптимальной пропускной способности и точности при работе с одним ускорителем, а Ultra — для максимальной «агентской точности» в средах ЦОД с несколькими ускорителями.
Как сообщает NVIDIA, обширное дообучение было проведено в сервисе NVIDIA DGX Cloud с использованием высококачественных курируемых синтетических данных, сгенерированных NVIDIA Nemotron и другими открытыми моделями, а также дополнительных курируемых наборов данных, совместно созданных NVIDIA. Обучение включало 360 тыс. часов инференса с использованием ускорителей H100 и 45 тыс. часов аннотирования человеком для улучшения возможностей рассуждения. По словам компании, инструменты, наборы данных и методы оптимизации, используемые для разработки моделей, будут в открытом доступе, что предоставит предприятиям гибкость в создании собственных пользовательских рассуждающих моделей.
источник: 3dnews.ru
Одной из ключевых функций NVIDIA Llama Nemotron является возможность включать и выключать опцию рассуждения. Это новая возможность на рынке ИИ, утверждает компания. Anthropic Claude 3.7 имеет несколько схожую функциональность, хотя она является закрытой проприетарной моделью. Среди моделей с открытым исходным кодом IBM Granite 3.2 тоже имеет переключатель рассуждений, который IBM называет «условным рассуждением».
Особенность гибридного или условного рассуждения заключается в том, что оно позволяет системам исключать вычислительно затратные этапы рассуждений для простых запросов. NVIDIA продемонстрировала, как модель может задействовать сложные рассуждения при решении комбинаторной задачи, но переключаться в режим прямого ответа для простых фактических запросов.
NVIDIA сообщила, что целый ряд партнёров уже использует модели Llama Nemotron для создания новых мощных ИИ-агентов. Например, Microsoft добавила Llama Nemotron и микросервисы NIM в Microsoft Azure AI Foundry. SAP SE использует модели Llama Nemotron для улучшения возможностей своего ИИ-помощника Joule и портфеля решений SAP Business AI. Кроме того, компания использует микросервисы NVIDIA NIM и NVIDIA NeMo для повышения точности завершения кода для языка ABAP.
ServiceNow использует модели Llama Nemotron для создания ИИ-агентов, которые обеспечивают повышение производительности и точности исполнения задач предприятий в различных отраслях. Accenture сделала рассуждающие модели NVIDIA Llama Nemotron доступными на своей платформе AI Refinery. Deloitte планирует включить модели Llama Nemotron в свою недавно анонсированную платформу агентского ИИ Zora AI. Atlassian и Box также работают с NVIDIA, чтобы гарантировать своим клиентам доступ к моделям Llama Nemotron.

AI-рассуждение — это способность интеллектуальной системы делать логические выводы, принимать решения и решать задачи, используя накопленные знания, данные и правила вывода. 3
Некоторые типы AI-рассуждений:
- Дедуктивное рассуждение. Включает в себя составление конкретных выводов из общих правил или предпосылок. Это наиболее точная форма рассуждения, при которой выводы логически гарантированы, если предпосылки верны. 4
- Индуктивное рассуждение. В отличие от дедуктивного рассуждения, индуктивное рассуждение делает обобщения на основе конкретных наблюдений. Например, система искусственного интеллекта может наблюдать многочисленные случаи события и выводить общее правило. 4
- Абдуктивное рассуждение. Этот тип рассуждений начинается с наблюдения или набора наблюдений, а затем стремится найти самое простое и наиболее вероятное объяснение. 4
- Рассуждение по аналогии. Это включает в себя составление выводов на основе сходства между новыми ситуациями и ранее понятными сценариями. 4
- Вероятностные рассуждения. Системы искусственного интеллекта используют вероятностные рассуждения для принятия решений или прогнозов в условиях неопределённости. 45
- Рассуждение на основе здравого смысла. Это включает в себя рассуждения, использующие повседневные знания о мире. Системы искусственного интеллекта с возможностями рассуждения на основе здравого смысла могут делать предположения и принимать решения, аналогичные человеческим, используя обширную базу общих знаний о том, как устроен мир. 4
Для примера можно привести API OpenAI o3-mini-high, которое предоставляет передовые возможности для решения сложных задач, включая глубокое рассуждение. 2
AI-рассуждение — это способность интеллектуальной системы делать логические выводы, принимать решения и решать задачи, используя накопленные знания, данные и правила вывода. 2
Существует пять типов AI-рассуждений:
Рассуждения в ИИ находят приложения в различных областях, в том числе:
- Системы поддержки принятия решений. ИИ используют рассуждения для предоставления рекомендаций по принятию решений в таких областях, как финансы, здравоохранение и логистика. 4
- Обработка естественного языка. Рассуждения помогают в понимании и создании согласованных ответов в человеческом языке. 4
- Робототехника. Системы искусственного интеллекта используют рассуждения для планирования и выполнения задач в робототехнике, облегчая интеллектуальное взаимодействие с окружающей средой. 4
- Медицинская диагностика. Вероятностные рассуждения помогают в медицинской диагностике, оценивая вероятность различных заболеваний на основе симптомов и данных пациентов. 4
Также с помощью AI-рассуждений можно, например, написывать сочинения-рассуждения. Для этого нужно ввести тему, ключевые идеи и другие исходные данные, а AI-помощник превратит это в связный, логичный и стилистически грамотный текст. 5
