Всем привет!

Сегодня поговорим про пазлы и как увлечение собирать пазлы помогло мне придумать новый формат разметки WSI изображений.

WSI — огромные картинки, которые не помещаются в голову (и в память видеокарты тоже)

Когда я говорю, что работаю в медтехе, многие сразу представляют себе КТ и МРТ — и не ошибаются. Но этим медицинские изображения не ограничиваются. Сегодня хочу рассказать о менее известном, но очень важном формате — WSI.

WSI (Whole Slide Image) — это скан гистологического препарата, то есть слайда ткани, который смотрит под микроскопом врач-патоморфолог. Только микроскоп тут цифровой. Представьте себе не просто фото, а целое полотно ткани, отсканированное с микронным разрешением.
Разрешение у таких изображений — десятки тысяч пикселей по каждой стороне. А вес — 4–8 ГБ и больше. Пример приложу

Разметить такую махину вручную невозможно. Во-первых, один специалист будет делать это вечность. Во-вторых, где гарантия, что он дойдёт до конца и не сбежит посреди процесса?

Поэтому мы используем приём, который прозвали разметкой мозайкой.

Берём WSI, режем на квадраты, например 1024×1024 пикселя. Эти кусочки мы и отдаём врачам — каждый размечает только то, что видно на его «плитке».

А после этого мы собираем всё обратно, как пазл.
В результате получается полноценная разметка гигантского изображения — без страданий и вечности в дедлайне.

Вроде бы всё просто, но именно так невозможное становится выполнимым.
И теперь мы активно используем этот подход в задачах по детекции опухолей

Если вы никогда не слышали про WSI — теперь слышали.
И, честно говоря, это один из самых зрелищных и одновременно адовых форматов, с которым мне доводилось работать