DeepSchool
Назад
Илья Димов

Илья Димов

LLMЯндексОбучениеПоиск работыЗадачиУскорение/профилирование

22 октября 2025 г. · 18 постов

Посты

Всем привет! Меня зовут Илья Димов и на этой неделе канал буду вести я. Кто-то уже может быть со мной знаком по DeepSchool - я пару раз засветился на ...

22 окт. 2025 г.
326 31

2/3 После этого я понял, что если хочешь чем-то заниматься, то нужно изучать это глубоко. В каком-то роде это является отсевом - если что-то не нрави...

22 окт. 2025 г.
308 14

3/3 Лично я для себя понял несколько вещей: Если изучаете что-то - изучайте глубоко, но не теряйте из вида “картины целиком”. Например вам стоит пон...

22 окт. 2025 г.
297 19

На этой позитивной ноте на сегодня все, поэтому держите мем с лысым котом, а уже завтра вернусь с интерактивом, поговорим немного про то, как понять, ...

22 окт. 2025 г.
292 17

Всем привет! Задачку про ускорение обучения перенес на завтра, а сегодня поговорим про такую вещь как чтение статей. Достаточно часто проскакиевает во...

23 окт. 2025 г.
335 16

В комментарии под предыдущим постом Дмитрий рассказал про свой пайплайн чтения статей, а теперь и моя очередь! Долгое время я печатал на работе стать...

23 окт. 2025 г.
335 21

Напоследок хочется еще похвалить alphaxiv — в нем хранится история чатов, также можно хайлайтить любой кусок статьи и писать туда свой комментарий. Вс...

23 окт. 2025 г.
365 19

Как и обещал, сегодня интерактив! Вот такой вот простой код на питоне с функцией активации gelu. Хочется его ускорить минимальными усилиями, желател...

24 окт. 2025 г.
312 7
3

Не ожидал, что вы накидаете столько вариантов! Все они по-своему валидны, но я задумывал рассказать

Не ожидал, что вы накидаете столько вариантов! Все они по-своему валидны, но я задумывал рассказать про `torch.compile()`. Кодом со скриншота можно сн...

24 окт. 2025 г.
297 10

Вижу, что вам понравился интерактив, поэтому вчера я заготовил вам еще одну задачу посложнее!. У нас есть нейросеть, которая применяет к слою нашу быс...

24 окт. 2025 г.
337 5

Тут проблема скрывалась в том, что `if mask.any()` требует синхронизации между GPU <-> CPU для опеределения потока управления, из-за чего в GPU профил...

26 окт. 2025 г.
306 9

Хочется завершить рассказ про профилирование историей из жизни! У соседней команды была TTS модель. Когда она включалась, время ответа пользователю с...

26 окт. 2025 г.
314 16

Из всех рассказов по теме профилирования и ускорения, хочется выделить 2 мысли: 1. Не профилировали - не ускоряйте. Часто мы бежим что-то ускорять, п...

26 окт. 2025 г.
298 13

На ночь глядя список ресурсов, что почитать по теме GPU: * Курс по CUDA - https://people.maths.ox.ac.uk/~gilesm/cuda/ * Супер онлайн ресурс, где можн...

26 окт. 2025 г.
423 19

Наша неделя вместе понемногу подходит к концу, но мы еще не прощаемся, я еще заготовил для вас пару постов! Хотелось бы поднять тему отдыха. Я считаю...

28 окт. 2025 г.
311 11

Я уже писал выше, что на мой взгляд лучший способ с чем-то разобраться это практика. Довольно часто на курсах/вебинарах спрашивают хорошие материалы п...

28 окт. 2025 г.
388 13
2

Сам я шел путем 3 - именно воспроизводил своими руками stablebaselines3. Одна из базовых сред для rl - lunarlander. Есть ракета, которую нужно посадит...

28 окт. 2025 г.
326 18

Всем доброе утро! Передаю вас следующему автору, но не ухожу далеко) Очень понравилось вести канал и проводить интерактивы, так что при желании можно...