Инженер Meta Марк Саруфим (Mark Saroufim) объявил о старте соревнования по ускорению пакетного QR-разложения на графических процессорах NVIDIA B200. Приз за лучшее решение — 10 тысяч долларов.
Соревнование, организованное при поддержке NVIDIA, ставит задачу оптимизировать алгоритм QR-разложения для работы с пакетами матриц на новых GPU B200. Участникам предстоит добиться максимальной производительности при обработке 100 тысяч матриц размером 1024×1024. Текущий эталонный результат — 1,2 терафлопс на одну матрицу — должен быть улучшен как минимум в два раза.
По словам Саруфима, QR-разложение критически важно для ряда приложений в области машинного обучения, включая обучение моделей и обработку больших данных. «Эффективная реализация этого алгоритма на современных GPU может существенно ускорить работу нейросетей, особенно в задачах линейной алгебры», — отметил он в анонсе конкурса. Участникам разрешается использовать любые инструменты и библиотеки, включая CUDA и cuBLAS, но финальное решение должно быть воспроизводимым и открытым.
Конкурс продлится до 30 июня 2026 года. Победитель получит денежный приз в размере 10 тысяч долларов, а также возможность представить своё решение на конференции GTC 2026. Организаторы подчёркивают, что результаты соревнования могут быть использованы в реальных продуктах NVIDIA и Meta, включая фреймворки для глубокого обучения.
Ранее аналогичные инициативы по оптимизации вычислительных алгоритмов уже приводили к значительным прорывам в производительности. Например, в 2024 году конкурс по ускорению свёрточных нейросетей на GPU A100 позволил улучшить скорость обработки изображений на 30%.
Источники: X-пост Марка Саруфима (Mark Saroufim), 12 июня 2026 года; блог Meta Engineering.