Как Писец на Тотальный диктант ходил, или Пара слов о робастном распознавании речи. Иван Бондаренко (НГУ)

В 2024 году состоялся юбилейный, вот уже десятый по счёту «Тотальный диктант». Но «Писец» на него пришёл в первый раз. Вы не подумайте, ничего плохого не произошло! Просто «Писец» — это открытая система автоматической расшифровки различных звукозаписей, от журналистского интервью до заседания диссертационного совета. В своём докладе Иван рассказал о том, с какими трудностями им пришлось столкнуться при создании «Писца», как они используют Wav2Vec2 и Whisper в пайплайне распознавания и зачем им надо было файнтюнить Whisper. Узнайте, как современная модель сравнится с людьми в тотальном диктанте, посмотрев видео.
Back to Top