Максим Купрашевич — MiVOLO: State-of-the-Art визуальный трансформер для распознавания пола и возраста по фотографии
Ближайшая конференция VideoTech:
#VideoTech #Работасвидео #IT #conference #jugrugroup
Спикер расскажет о том, как его команда создавала новую трансформерную модель для распознавания одновременно пола и возраста, которая взяла первое место во всех основных бенчмарках. Даже в тех, чьи тренировочные данные никогда не видела.
Модель использует одновременно два входа: изображения лица и тела. Эффективно применяя механизмы перекрестного внимания, она не только умеет извлекать пользу от дополнительного входа, но и способна отрабатывать в случае подачи только одного из них.
Также Максим раскроет интересные дополнительные детали:
* Кто более точен в задачах определения возраста и пола по фотографии: человек или машина? Какая вообще у людей тут точность, и у всех ли она одинакова?
* Как получить разметку с возрастом, имея только обезличенные фотографии? Какая точность у модели, если лица не видны?
Приходите, чтобы узнать ответы на эти и другие вопросы.
Скачать презентацию с сайта —