Владислав Куренков, руководитель группы «Адаптивные агенты» в AIRI, расскажет о стремительно развивающейся и набирающей популярность среди исследователей области In-Context Reinforcement Learning. Доклад будет посвящён её истокам, существующим алгоритмам, таким как Algorithm Distillation и Decision Pre-Trained Transformer, а также её связи с Meta Reinforcement Learning.
Кроме того, будет затронута тема текущих подходов к созданию Generalist Agents без использования LLM и причин нехватки open-source моделей и бенчмарков в этом направлении.
Оппонентом выступит кандидат математических наук, научный сотрудник Международной лаборатории стохастических алгоритмов и анализа многомерных данных ФКН НИУ ВШЭ Сергей Самсонов.
855 views
1133
313
1 month ago 01:34:53 855
AIRI Seminars | In-Contex Reinforcement Learning
2 months ago 01:34:51 931
AIRI Seminars | Основные проблемы прикладной математики и ИИ
2 months ago 01:31:57 306
AIRI Seminars | Умнее значит лучше? Куда двигаются методы визуальной локализации и картографирования
2 months ago 01:25:40 380
AIRI Seminars | Оценка LLM на длинных контекстах: бенчмарки, результаты и подходы к удлинению контекста
3 months ago 01:31:47 419
AIRI Seminars | ИИ для регистрации, анализа и воспроизведения цвета
3 months ago 01:26:36 601
AIRI Seminars | Крупномасштабная структура естественного языка, или поймай бота
4 months ago 01:36:22 271
AIRI Seminars | Оптимальные алгоритмы асинхронного и параллельного обучения
4 months ago 01:23:53 1
Прямой эфир «LLM в AI Talent Hub»
7 months ago 01:39:07 1K
Первый Большой Семинар AIRI
1 year ago 00:01:58 16
Семинар по обидиенс Варвары Большаковой
1 year ago 01:33:45 1
Как мультимодальные модели учатся понимать текст, картинки, видео... — Андрей Кузнецов — Семинар AGI
1 year ago 01:33:51 67
Как мультимодальные модели учатся понимать текст, картинки, видео и аудио — Андрей Кузнецов — Семинар AGI
2 years ago 00:01:49 7
Семинар по обидиенс с Инной Баженовой
2 years ago 00:02:06 8
Семинар по обидиенс с Еленой Лимоновой
2 years ago 00:01:48 221
Семинар по обидиенс
2 years ago 01:43:13 4
Какие технологии приведут нас к AGI? — Татьяна Шаврина — Семинар AGI
2 years ago 00:04:00 8.8K
БДОУ г. Омска “Детский сад №130“_творческая мастерская по изготовлению открытки «Парусник» в технике Айрис фолдинг
2 years ago 01:07:33 1
Семинар NOML: Efficient Deep Active Learning for Text Processing.
2 years ago 00:03:58 1.6K
Семинар по обидиенс с Инной Баженовой, июль 2022
3 years ago 01:05:43 8
Курмуков Анвар (AIRI) «Эволюция обучения ResNet с 2015 и до наших дней»
3 years ago 01:53:43 1
Ирина Гуляева. Продажа ценности. Семинар E-commerce
4 years ago 00:08:34 2
Типичные ошибки категорийного менеджера - Екатерина Бузукова
5 years ago 00:03:12 1
Семинар “Актуальные аспекты заготовки кормов в сезон 2019 года“