Обучение эффективным представлениям для обнаружения голосовых команд с помощью Triplet Loss

Спикер: Роман Выгон, НТР, Томск, Россия. За последние несколько лет представления на основе triplet loss стали стандартом для некоторых важных задач компьютерного зрения, в особенности идентификации личности. Однако в области распознавания речи они практически не используются даже для задач классификации. Мы заполняем этот пробел, показывая, что комбинация представлений на основе triplet-loss и вариации kNN для классификации, вместо кросс-энтропии заметно улучшают точность конволюционных сетей на датасете LibriWords, полученном из LibriSpeech. ---- Чтобы не пропустить анонсы следующих научно-технических вебинаров, присоединяйтесь к нам в Telegram: Сайт организатора:

13 views