Разработчики библиотеки компьютерного зрения OpenCV сообщили о выходе новой версии и реализации на языке C++. Обновление подразумевает использование компилятора для C++11. Также в этой версии добавлена поддержка Graph API.
Изменения в версии OpenCV 4.0.0
Разработчики рассказали об удалении части API для языка C, присутствовавших с версии OpenCV 1.x. Среди них модули определения объектов, фото- и видеомодуль, модуль кодировщиков изображений, модуль чтения видео с камеры и записи его в файл, а также модуль калибровки камеры. Другие изменения коснулись:
- Хранения данных. Хранение и загрузка данных в файлы XML, YAML и JSON в основном модуле реализованы на C++ и несовместимы с API языка C. Поддержка кодирования файлов стандарта base64 реализована только для файлов XML и YAML.Модуля для работы с нейросетями DNN. После обновления он поддерживает архитектуру Mask-RCNN, частично нейросеть YOLO. Также добавлен экспериментальный бекэнд Vulkan, который необходим для вычислений, не работающих с OpenCL.Производительности. Оптимизированы алгоритмы обработки изображений на языке C++. По словам разработчиков, прирост скорости может составить от 15 до 30 %.Детектора и декодера QR-кодов. Их добавили в модуль opencv/objdetect вместе с примером.
Несмотря на обновления библиотек компьютерного зрения, эта область сталкивается с рутинными проблемами. Чтобы решить одну из них, команда Google AI разработала основанный на машинном обучении интерфейс, который сокращает время разметки объектов на фотографиях в три раза. Разработчики представили его в конце октября 2018 года и уверены, что он поможет быстрее создавать большие корпуса изображений для систем компьютерного зрения.
Источник: