Привет! Сегодня я хотел бы рассказать про два соревнования, которые дали мне статус kaggle эксперта. Они абсолютно разные, но оба из биомед домена, который интересует меня больше всего.
🩻 Первое соревнование проходило в 2024 году и было посвящено Computer Vision в работе с МРТ-снимками спины. В соревновании использовались МРТ-данные позвоночника. Для каждого пациента это был набор последовательных двумерных снимков, которые вместе образуют трёхмерное изображение спины. По этим данным нужно было определить, есть ли защемление поясничных нервов.
Я нашёл сокомандника из своего городка в пригороде Тель-Авива и присоединился к его команде. Мы обсудили многоступенчатую модель, в нее входили:
▪️сегментация нужных позвонков на вертикальных срезах
▪️сопоставление нужных горизонтальных срезов с детекций
▪️классификация нужных зон на отобранных срезах
Проверив, что всё работает, как ожидалось, мы разошлись по разным направлениям тестировать свои гипотезы. В итоге мы успели попробовать множество вещей, я даже улучшил публичный алгоритм сопоставления горизонтальных и вертикальных срезов, но самым успешным шагом стала оптимизация публичного YOLO бейзлайна, вдохновлённая лекциями CV rocket. В итоге после мерджа наших решений мы получили 103 место по миру и бронзовую медаль.
🧬 Вторым значимым для меня биомед проектом на kaggle стало соревнование по предсказанию трёхмерной структуры РНК от Стэнфорда в 2025 году.
Это была возможность попробовать свои силы в этом пока новом для меня домене. Так как мне не хватало доменной экспертизы, я нашёл себе сильного сокомандника биоинформатика. Моя зона ответственности была в том, чтобы затаскивать различные нейронки от передовых лабораторий в среду Kaggle и проверять результаты. Также мне было безумно интересно сделать файнтюн LoRA для опенсорс версии AlphaFold3 на данных соревнования, но в конечный зачёт это решение не дошло, потому что решения без использования информации о разных биологических видах априори проигрывали решениям с оными. Результатом стало 29 место по миру и серебряная медаль.
Из этих соревнований я вынес две вещи. Первое - на чистой удаче и энтузиазме крайне сложно получить результат мирового уровня. Результат приходит, когда ты лучше разобрался в домене, данных и в применении конкретной архитектуры под конкретную задачу. Второе, и наверно, более важное - чем быстрее ты можешь проверить свою гипотезу, узнать что работает, а что нет - тем лучше будет результат, даже если будет много ошибок. Потому что маленькие шаги позволяют проверить и узнать много, в то время как большие амбициозные шаги, основанные на собственных убеждениях, чаще уводят тебя с верного пути. И эти выводы я буду стараться привносить в свою дальнейшую работу за пределами kaggle.
1 / 2
Михаил Пома