Рекурсивное обучение — Герман Петров

Рекурсивное обучение

В последнее время я вспоминаю/изучаю много тем/подходов из CV и LLM. Здесь есть две большие боли - найти релевантные материалы и правильно их понять.

Первая решалась неплохо paperwithcode (RIP кста ⚰️) и гуглением, а вот второе всегда было более нетривиальной задачей. Одно дело разобрать структуру модели, другое - понять почему это работает именно так. Или имея задачу по ML на работе, понять, куда начать думать в сторону решения. Думаю, отсюда и возникла популярность ODS, так как это был самый короткий путь получить ответ почти на любой вопрос по ML/DL от опытных специалистов.

В январе мне попалось любопытное видео на эту тему. Габриэлю Петерссону всего 23 года, а он уже работает research scientist в OpenAI, в команде Sora. При этом он бросил обучение в старших классах школы, не получал нигде вышку и дошёл до работы в OpenAI с помощью ChatGPT.

📌 Меня особенно зацепила его идея "recursive gap filling / recursive learning". Не идти снизу вверх - сначала математика, потом уже проекты - а стартовать сразу со сложного проекта и рекурсивно проваливаться в непонятные места - top-down подход. В конце мы проходимся обратно уровень за уровнем, выстраивая свою систему знаний.

Прикольный момент из интервью про вышку. Представь, что ты много готовишься к поступлению, выбираешь факультет, связанный с ML, а дальше вам говорят - "На пару лет забудьте про ML, мы сейчас будем изучать фундаментальные знания по математике". ☹️

Как recursive learning выглядит на практике:
❤️Берёшь проект/цель чуть выше текущего уровня. Например - генерация видео.
❤️Просишь LLM накидать схематично решение/код - напиши код для обучения диффузии; дальше запускаешь, ловишь баги, чинишь.
❤️Далее проходишь по проекту и разбираешь все непонятные части, задаёшь вопросы пока не "щёлкнет": как работает диффузия, как устроены residual blocks и так далее.
❤️Можно попросить LLM подготовить вопросы по теме и пройтись по ним, чтобы убедиться, правильно ли ты понял.

Почему такой подход крут:
❤️LLM всегда под рукой. Можно задавать “почему?” столько раз, сколько нужно, менять уровень объяснения, просить аналогии/контрпримеры. Наше образование ограничено только нашим упорством.
❤️Быстрый feedback. Сразу видны результаты, которые привязаны к контексту
❤️On-demand knowledge aka знания по запросу. Мы не учим всё подряд, а закрываем только те места, которые мешают двигаться дальше.

Видос с таймкодом блока про обучение.

Что думаете насчёт использования LLM в образовании/самообразовании? Какие у вас лайфхаки по изучению DL? 👇👇👇

Другие выпуски