Embodied AI Reading Club | Построение стратегии поведения по языковой инструкции в сложных мультимодальных средах
В докладе рассматриваются идеи, предложенные в статьях “Game On: Towards Language Models as RL Experimenters“ () и “Instruction Following with Goal-Conditioned Reinforcement Learning in Virtual Environments“ ().
В первой работе авторы используют большую языковую модель для построения учебного плана обучения RL-агента в задаче следования инструкциям, что позволяет автоматически генерировать последовательность подзадач для эффективного обучения. Во второй статье языковая модель предсказывает высокоуровневый план по языковой инструкции, а RL-агент обучается с помощью учебного плана на различных списках возможных задач
Недостатком этих подходов является необходимость иметь заранее определенный список подзадач, на основе которого языковая модель формирует план. Однако хотелось бы, чтобы модель самостоятельно строила план, не полагаясь на заданный перечень возможных задач
Рассматриваются подходы, которые позволяют:
– строить стратегию поведения в сложных мультимодальных средах по языковой инструкции
– формировать автономные учебные планы с помощью языковых моделей для обучения RL-агента
– создавать гибкие планы действий без фиксированного списка подзадач
Статьи:
1. Game On: Towards Language Models as RL Experimenters:
2. Instruction Following with Goal-Conditioned Reinforcement Learning in Virtual Environments:
Не пропускайте анонсы новых мероприятий и будьте в курсе новостей:
▪️Телеграм-канал AIRI:
▪️Комьюнити AIRI: g57c7ytnSY9jYzUy
▪️Телеграм-канал Embodied AI Reading Club:
38 views
1090
296
1 month ago 00:09:44 1
Cosmo World , Minato Mirai vlog^
1 month ago 00:51:13 371
Co-Evolving Teaching Practices in the AI Age | IEW2024
1 month ago 00:02:12 8
Picture this: ‘Ming dynasty official’ Elon Musk tackling laziness one kick at a time
1 month ago 00:48:48 257
Embodied AI Reading Club | Новые подходы в области RL агентов с памятью
1 month ago 00:01:13 5
Birch Grove of Fear
1 month ago 00:01:52 1
Bitcoin Holders | Power in Crypto 4K
2 months ago 00:01:53 502
[Royal Trailer] The Legend of Zelda (2025) - Teaser Trailer | Tom Holland, Anya Taylor-Joy
2 months ago 00:55:50 38
Embodied AI Reading Club | Построение стратегии поведения по языковой инструкции в сложных мультимодальных средах
2 months ago 00:03:28 29
[Poltan] БАЙДЕН - Я РУССКИЙ (AI COVER)
2 months ago 01:12:34 62
Embodied AI Reading Club | Vision-and-Language Navigation
2 months ago 01:07:05 34
Embodied AI Reading Club | Rep’n’plan-подходы к построению и коррекции плана действий с помощью LLM для Embodied AI
2 months ago 01:17:43 44
Embodied AI Reading Club | Применение трансформерных моделей для Embodied AI
2 months ago 00:38:37 82
Embodied AI Reading Club | Методы определения неопределённости языковых моделей
2 months ago 00:25:48 1
What do tech pioneers think about the AI revolution? - BBC World Service
2 months ago 00:00:55 1
Meet ENGINEAI Flagship SE01 Humanoid AI Hardware.
2 months ago 00:01:00 1
COUNTRIES AS WARRIORS 💀 #countries #Warriors #Warrior #ai #fast_ai
2 months ago 00:02:17 1
Introducing Unitree Go2 - Quadruped Robot of Embodied AI from $1600
2 months ago 00:06:31 1
Pink Floyd- Dark Side of the moon - Money- Video Animation for Competition
2 months ago 00:01:00 4
COUNTRIES AS WARRIORS 💀 #countries #Warriors #Warrior #ai #fast_ai #midjourney #chatgpt
2 months ago 00:08:06 1
Mystery of The Ancient Greek City Bizarrely Located in Afghanistan
2 months ago 00:01:01 1
Ai Draws Countries As Like Animals Part 5!
2 months ago 00:03:20 1
Retro Future Visions - 1950s Simplicity Reimagined - Dreams of the 1950s.
2 months ago 02:00:00 1
Pilgrimage of the Knights Templar - Chants of the Holy Mission
2 months ago 02:04:57 1.7K
AIJ Contest 2024: разбор задачи Embodied AI (вебинар 2)