D-FINE : метод регрессии bounding box в детекторах объектов на основе DETR

D-FINE : метод регрессии bounding box в детекторах объектов на основе DETR. D-FINE - детектор объектов в режиме реального времени, который предлагает улучшение регрессии bounding box в моделях DETR . D-FINE обладает высокой точностью локализации, определяя регрессию рамок как процесс итеративного уточнения распределений вероятностей. D-FINE состоит из двух компонентов: Мелкозернистое уточнение распределения (Fine-grained Distribution Refinement, FDR). FDR преобразует процесс регрессии из предсказания фиксированных координат в итеративное уточнение распределений вероятностей. Эта техника дает более детальное промежуточное представление, что повышает точность локализации. Глобальная оптимальная локализованная самодистилляция (Global Optimal Localization Self-Distillation, GO-LSD). GO-LSD - двунаправленная стратегия оптимизации, которая передает знания о локализации из уточненных распределений в более ранние слои модели через самодистилляцию. Старшие версии D-FINE -L и D-FINE -X достигают 54,0% и 55,8% AP на наборе данных COCO соответственно, работая со скоростью 124 и 78 FPS на GPU NVIDIA T4. При предварительном обучении на Objects365 D-FINE -L и D-FINE -X показывают 57,1% и 59,3% AP, что выше всех существующих детекторов реального времени. Разработчики D-FINE ,
Back to Top