Александр Абрамов - RLHF for retrieval based NLP system
- Как мы используем retrieval для ведения диалога
- Из каких компонент состоит наша диалоговая система
- Улучшение retrieval свойств на уровне embeddings:
- а. Критик подход selfchat arena.
- б. Классик PPO
- Выводы: влияние на метрики моделей (таблица с метриками до/после RLHF)
- Развитие. Интересные подходы:
- InstructOR как развитие нашего multitask: retrieval, IR, qa, sentiment etc.
- Оркестрация компонент NLP системы с MultiArmed bandits.
Data Fest 2023:
Трек “Instruct Models“:
Наши соц.сети:
Telegram:
Вконтакте:
2 views
227
88
1 week ago 00:02:03 3
Александр Абрамов “Калькулятор“
1 week ago 00:05:54 438
Максимилиан Волошин “Государство“ (читает Александр Абрамов)
1 week ago 00:35:50 12
Ансамбль электромузыкальных инструментов п. у. Вячеслава Мещерина
2 weeks ago 02:26:09 51
[GSPD & DEAD BLONDE] GSPD Москва . Live Arena. 11 тысяч человек
2 weeks ago 02:09:47 371
Пленарное заседание конференции по управлению цифровой трансформацией общего образования
2 weeks ago 00:02:17 20
Чтобы сохранить дружбу народов
2 weeks ago 00:30:50 255
[Anton S Live] Ида Галич, Ивлеева, какое же дно. Рожай баба, РОЖАЛКА работает. Рогов против Фомина. Марк Горобец
2 weeks ago 00:18:17 839
Интервью на портале Russian Business Guide
2 weeks ago 00:58:31 148
Будем помнить! - Сборник песен военных лет
2 weeks ago 00:52:54 50
Сборник мотивирующих военных песен | Сборник песен военных лет
2 weeks ago 00:39:50 103
Военное наследие | Сборник песен военных лет
2 weeks ago 00:43:11 554
Советские песни ко Дню Победы | Сборник песен военных лет
2 weeks ago 00:16:10 587
[Евгений Замотаев] Евгений Замотаев - про срочную службу в армии | Стендап 2021
2 weeks ago 00:00:52 26
Московский театр Олега Табакова представит спектакль “Матросская тишина“ по пьесе Александра Галича в Тобольске