# Mistral AI представила модель Mistral OCR 4 для распознавания документов на 170 языках

> Французский стартап Mistral AI выпустил новую версию модели оптического распознавания текста (OCR) Mistral OCR 4, которая показала точность 85,2% на бенчмарке OlmOcrBench для структурированной обработки документов.

- Canonical HTML: https://youragents.me/ru/media/news/mistral-ai-predstavila-model-mistral-ocr-4-dlja-raspoznavanija-dokumentov-na-170-jazykah
- Markdown: https://youragents.me/ru/media/news/mistral-ai-predstavila-model-mistral-ocr-4-dlja-raspoznavanija-dokumentov-na-170-jazykah.md
- Section: Новости
- Published: 2026-06-25T00:37:41+03:00
- Modified: 2026-06-25T00:37:41+03:00

Французский стартап Mistral AI выпустил новую версию модели оптического распознавания текста (OCR) Mistral OCR 4, которая показала точность 85,2% на бенчмарке OlmOcrBench для структурированной обработки документов. Модель поддерживает 170 языков, включая редкие и малоресурсные. 

Mistral OCR 4 стала очередным шагом компании в развитии технологий извлечения данных из документов. По данным разработчиков, модель превосходит предыдущие версии по точности и охвату языков, что делает её одной из наиболее универсальных на рынке. Бенчмарк OlmOcrBench, на котором тестировалась система, включает разнообразные форматы документов — от таблиц и анкет до рукописных текстов.

Особенностью новой модели стала оптимизация для работы с низкоресурсными языками, где традиционные OCR-системы часто дают сбои. Mistral AI не раскрывает детали архитектуры, но отмечает, что модель обучена на синтетических и реальных данных, собранных из открытых источников. В блоге компании подчёркивается, что Mistral OCR 4 может применяться в автоматической обработке юридических, медицинских и финансовых документов, где важна высокая точность распознавания.

Ранее Mistral AI уже выпускала OCR-модели, но четвёртая версия стала первой, поддерживающей столь широкий спектр языков. Конкуренты, такие как Google и Amazon, предлагают аналогичные решения, но с меньшим охватом или более высокой стоимостью для корпоративных клиентов. В отличие от них, Mistral AI позиционирует свою модель как открытую для интеграции через API, что может снизить порог входа для стартапов и исследователей.

Сооснователь Mistral AI Гийом Лампль (Guillaume Lample) в своём посте на X отметил, что работа над моделью заняла более года и потребовала сотрудничества с лингвистами и экспертами по обработке документов. «Это не просто улучшение точности — мы переосмыслили подход к OCR, чтобы сделать его по-настоящему глобальным инструментом», — написал он.

Источники: X-пост Гийома Лампля (Guillaume Lample), 23 июня 2026; блог Mistral AI.
