Французский стартап Mistral AI выпустил новую версию модели оптического распознавания текста (OCR) Mistral OCR 4, которая показала точность 85,2% на бенчмарке OlmOcrBench для структурированной обработки документов. Модель поддерживает 170 языков, включая редкие и малоресурсные.
Mistral OCR 4 стала очередным шагом компании в развитии технологий извлечения данных из документов. По данным разработчиков, модель превосходит предыдущие версии по точности и охвату языков, что делает её одной из наиболее универсальных на рынке. Бенчмарк OlmOcrBench, на котором тестировалась система, включает разнообразные форматы документов — от таблиц и анкет до рукописных текстов.
Особенностью новой модели стала оптимизация для работы с низкоресурсными языками, где традиционные OCR-системы часто дают сбои. Mistral AI не раскрывает детали архитектуры, но отмечает, что модель обучена на синтетических и реальных данных, собранных из открытых источников. В блоге компании подчёркивается, что Mistral OCR 4 может применяться в автоматической обработке юридических, медицинских и финансовых документов, где важна высокая точность распознавания.
Ранее Mistral AI уже выпускала OCR-модели, но четвёртая версия стала первой, поддерживающей столь широкий спектр языков. Конкуренты, такие как Google и Amazon, предлагают аналогичные решения, но с меньшим охватом или более высокой стоимостью для корпоративных клиентов. В отличие от них, Mistral AI позиционирует свою модель как открытую для интеграции через API, что может снизить порог входа для стартапов и исследователей.
Сооснователь Mistral AI Гийом Лампль (Guillaume Lample) в своём посте на X отметил, что работа над моделью заняла более года и потребовала сотрудничества с лингвистами и экспертами по обработке документов. «Это не просто улучшение точности — мы переосмыслили подход к OCR, чтобы сделать его по-настоящему глобальным инструментом», — написал он.
Источники: X-пост Гийома Лампля (Guillaume Lample), 23 июня 2026; блог Mistral AI.