Новости 20:37, 27 мая 2026
Поделиться

Исследователи представили модель EPICURE, сжимающую 4,1 млн рецептов в 2 МБ

Группа учёных под руководством Джозефа Чена (Josef Chen) опубликовала на arXiv модель EPICURE, которая анализирует 4,1 млн рецептов на семи языках и выделяет 1790 ключевых ингредиентов в 300-мерном пространстве. Модель занимает всего 2 МБ и позволяет сравнивать кулинарные традиции разных культур.

Исследователи из некоммерческого проекта EPICURE представили модель факторного разложения, способную обрабатывать крупнейший на сегодня массив кулинарных данных. В основу легли 4,1 млн рецептов на английском, китайском, испанском, французском, итальянском, японском и эфиопском языках. Модель выделяет 1790 базовых ингредиентов и проецирует их в 300-мерное векторное пространство, где близкие точки соответствуют схожим кулинарным традициям.

По словам авторов, EPICURE позволяет не только классифицировать блюда, но и выявлять скрытые связи между кухнями. Например, как отметил в шутливом посте исследователь Равид Шварц-Зив (Ravid Shwartz-Ziv), вектор между китайской и эфиопской кухнями оказался «удивительно интерпретируемым» — то есть модель выделяет конкретные ингредиенты или техники, отличающие эти традиции. Визуализация данных с помощью алгоритма UMAP напоминает географическую карту, где регионы соответствуют кулинарным стилям.

Ключевая особенность модели — её компактность. Несмотря на объём исходных данных, EPICURE занимает всего 2 МБ, что делает её пригодной для использования на устройствах с ограниченными вычислительными ресурсами. Авторы подчёркивают, что модель не только воспроизводит известные кулинарные связи (например, близость итальянской и испанской кухонь), но и обнаруживает неочевидные закономерности, которые могут быть полезны для пищевой промышленности или антропологических исследований.

Публикация вызвала интерес в научном сообществе: пост Чена набрал почти 900 тыс. просмотров, а комментарии других исследователей подчёркивают потенциал модели для изучения культурных взаимосвязей через призму кулинарии. Полный текст работы доступен на arXiv.

Источники: X-пост Джозефа Чена, 26 мая 2026; X-пост Равида Шварц-Зива, 27 мая 2026; публикация на arXiv.