⚡️ LoRA может быть так же хороша, как полный fine-tuning, но в разы дешевле
Thinking Machines выпустили новое исследование, которое смотрит на LoRA под другим углом.
Главная идея исследования: LoRA может обучаться почти как полный fine-tuning, но при этом быть проще, дешевле и предсказуемее.
Они доказали это экспериментально: взяли одинаковую модель, прогнали обучение двумя способами: полным fine-tuning и LoRA - и сравнили кривые потерь (loss vs steps).
Процесс:
- Дали чёткий рецепт, а не случайные гипотезы.
- Показали, что процесс можно повторять с одинаковым результатом.
- Выяснили, что если адаптеру не хватает памяти, модель не ломается, а просто замедляется.
Результат показал, что при правильных настройках LoRA движется по той же траектории, что и FullFT. То есть качество модели и динамика обучения совпадают, пока у адаптера хватает параметров. Когда лимит достигается, у LoRA кривая не «обрывается», а просто идёт дальше медленнее.
Именно за счёт этого LoRA демонстрирует предсказуемое и воспроизводимое поведение, а не случайные провалы, которые часто происходят при подборе гиперпараметров «на глаз».
✔️ Правила от команды Thinking Machines
1. Ставить LoRA на все слои, а не только на attention.
2. Использовать ~10× больший learning rate, чем обычно.
3. Не раздувать batch size - иначе падает стабильность.
✔️ Что в итоге:
- Кривые обучения LoRA почти совпадают с full fine-tuning.
- Даже в упоре в лимит адаптера модель ведёт себя плавно.
- Вычислений требуется на треть меньше, чем у FullFT.
LoRA может стать инструментом для надёжного и дешёвого пост-трейнинга.
Для Thinking Machines это шаг к миссии: они уверены, что непредсказуемость моделей - это не фича, а баг, который можно исправить.
Если убрать случайность и сделать выходы стабильными - ИИ станет безопасным даже для критически важных процессов.
338 views
1
0
1 week ago 00:06:15 2
Как нарисовать букву Х | АЛФАВИТ ЛОР | Рисование для детей с Кирой 🎨
1 week ago 00:13:44 16
АЛФАВИТ ЛОР В РЕАЛЬНОЙ ЖИЗНИ, ЗЛАЯ БУКВА “F” НАШЛА НАС!
1 week ago 00:10:10 4
ПОЧТИ ВЫВЕЛ P250 АЗИМОВ НА GGDROP / ГГДРОП — ЛОУ БАЛАНС ДАЛ НАДЕЖДУ НО ВСЁ СОРВАЛОСЬ
1 week ago 00:08:13 7
ОКУП=СЛИВ НА GGDROP!С ЛОУ БАЛАНСА ДО НОЖА!(36ЧАСТЬ)#ggdrop #ггдроп #ксго #csgo #ggdropпромокод
1 week ago 00:07:49 3
6 НЕ ОКУПОВ ПОДРЯД НА GGDROP!С ЛОУ БАЛАНСА ДО НОЖА(37ЧАСТЬ)#ggdrop #ггдроп #ксго #csgo #ggdropпромо
1 week ago 00:02:38 1
Вевил - Лора @ Свобода, Москва,
1 week ago 00:07:59 9
ГГДРОП СДУЛСЯ?? ПОСЛЕ ВЫДАЧИ ШАНСЫ ВЫКЛЮЧИЛИСЬ?? CASE BATTLE VS GGDROP!! БИТВА САЙТОВ!!
1 week ago 00:07:14 4
GGDROP: ЭТО БЫЛ ХУДШИЙ ДЕП В РАЗМЕРЕ 1000 РУБЛЕЙ? | ПРОМО: NIGHT10
1 week ago 00:07:28 6
ПРОВЕРИЛ ШАНСЫ НА GGDROP! СКОЛЬКО НОЖЕЙ ВЫБИЛ НА ГГДРОП !? РОЗЫГРЫШ !
1 week ago 01:13:35 1
«Они» (Ils)
1 week ago 00:07:58 8
ЭТО ОЧЕНЬ ХОРОШИЙ КЕЙС НА GGDROP! СЫПИТ ОЧЕНЬ БОДРО! #ggdrop #opencase #skins #cases #ггдроп #кейсы
1 week ago 00:07:26 1
ЧТО ЖЕ ВЫПАЛО С МОЕГО ЛОУ БАЛИКА НА GGDROP / ГГДРОП — РЕЗУЛЬТАТ СИЛЬНО УДИВИЛ
1 week ago 00:09:39 1
Я ВЕРНУЛСЯ К НИМ!! ПРОВЕРИЛ АБСОЛЮТНО ВСЕ МУЛЬТИКЕЙСЫ НА САЙТЕ GGDROP!! СДЕЛАЛ КОМБЕК! ГГДРОП УДИВИЛ
1 week ago 00:08:00 5
КАК ТАКОЕ МОЖЕТ БЫТЬ ? CASEBATTLE ЭТО ПРОСТО ПИЗ*ЕЦ! #casebattle #skins #скины #кейсбатл