04.06.2026

В России разрабатывают компактные ИИ-модели для работы с документами

Институт искусственного интеллекта AIRI при поддержке Сбера разрабатывает семейство компактных ИИ-моделей Optimal Cognitive Core. Первая модель этого семейства называется OCC-RAG. Она создана для задач, где важно не просто генерировать текст, а точно отвечать на вопросы по документам, использовать заданный контекст и не придумывать факты, если нужной информации нет.

Что такое OCC-RAG

OCC-RAG — это компактная ИИ-модель, ориентированная на работу с внешними источниками. Она использует подход RAG, при котором ответ строится не только на знаниях самой модели, а на информации из предоставленных документов. Такой принцип особенно важен для бизнеса, где ошибка в ответе может привести к финансовым, юридическим или репутационным рискам.

Модель должна уметь связывать факты из разных частей текста, отвечать по заданному контексту и отказываться от ответа, если данных недостаточно. Это отличает её от универсальных крупных моделей, которые иногда могут звучать уверенно, но выдавать неточную или выдуманную информацию.

Почему компактные модели важны

Крупные языковые модели требуют мощных серверов, дорогих вычислений и большого количества ресурсов. Это подходит не всем компаниям. Во многих практических задачах бизнесу нужна не максимальная универсальность, а скорость, экономичность и точность работы с конкретными документами.

OCC-RAG доступна в версиях на 0,6 млрд и 1,7 млрд параметров. Благодаря этому её можно запускать не только на серверной инфраструктуре, но и на более обычных устройствах, включая ноутбуки и смартфоны. Такой формат снижает стоимость использования и может быть полезен там, где важны локальная работа и контроль над данными.

Где может применяться модель

OCC-RAG может использоваться в корпоративных базах знаний, клиентской поддержке, финансовых сервисах, юридических отделах, комплаенсе, медицинских справочных системах и других сферах, где нужно быстро искать точные ответы в документах.

Например, сотрудник может задать вопрос по внутреннему регламенту, а модель найдёт нужный фрагмент и сформулирует ответ на его основе. В юридической сфере такая система может помогать работать с договорами и нормативными документами, а в поддержке — быстрее находить ответы в инструкциях и правилах обслуживания.

Открытый доступ и дальнейшее развитие

Модель выложена в открытый доступ, что позволяет разработчикам и компаниям тестировать её, адаптировать под свои задачи и встраивать в собственные продукты. Для российского рынка это особенно важно, потому что бизнесу нужны решения, которые можно разворачивать внутри своей инфраструктуры и применять к русскоязычным документам.

Следующим этапом развития Optimal Cognitive Core называют переход к агентному ядру. Это означает, что будущая система сможет не только отвечать по предоставленному тексту, но и самостоятельно искать недостающий контекст в поисковых системах, базах данных, корпоративных сервисах и репозиториях кода.

Заключение

Разработка AIRI и Сбера показывает интерес к более компактным и прикладным ИИ-моделям. Вместо гонки за максимальным размером акцент переносится на практическую пользу: работу с документами, снижение стоимости, быстрые ответы, локальный запуск и более строгую привязку к источникам.

OCC-RAG может стать полезным инструментом для компаний, которым нужен не просто чат-бот, а модель для точной работы с корпоративной информацией. Если развитие агентного ядра окажется успешным, такие системы смогут стать важной частью бизнес-инфраструктуры для поиска, анализа и обработки данных.

Добавить комментарий