и снова здравствуйте👋

как и обещал, сегодня расскажу про свои задачи в медиаисследовательской компании в роли CV-инженера🤓

я работаю с мультимодалкой: видео, статичные баннеры наружки + анимация и радио. всё от сырых данных до сервисов в проде, полный цикл, чтоб аналитикам и коллегам было удобно ковыряться

задачки попадаются обычно очень разноплановые, а потому достаточно интересные, вот топ-3 свежих:

*живой таймлайн по видео: разбирал ролики по секундам - где логотип мелькнул, слоган висит, юридичка (дисклеймеры) выскакивает, селебы в кадре, даты/места/объекты. выход - таймлайн как event-log: "0:05-0:12 бренд А (МТС), 0:15 селеба B (Нагиев)". в конце концов есть полное представление о том, что творится в ролике с разбивкой по классам;

- UI для клиентов с семантикой: слепил дашборд, куда сваливается вся инфа по креативу - траты, охваты, статистика + визуалы. добавил семантический поиск по картинкам (найди похожие баннеры/видео) [на тестах всем почему-то очень понравилось искать "форель"🤷‍♀️], группировку/фильтры по объектам/логотипам. плюс детальная разборка каждого: что в кадре, сколько висело. клиенты теперь сами могут всё рыть, не дергая нас;

- ключевые кадры из роликов: выжимал из видео топ-кадры - те, где максимум сока (бренд, лица, ключевые объекты), чтоб минимизировать объём без потерь. задачка на feature extraction + ranking: бери только нужное, остальное на свалку. получилось компактно и точно, с учётом домена было достаточно сложно определить ключевой кадр, который ключевым будет именно для наших целей, а не по сюжету в целом

но, как говорится, человеку иногда нужен отдых даже от интересных задач на работе, поэтому я вырвался в долгожданный отпуск, чтобы заценить Сфинкса🥴

а вы куда в последний раз залетали в отпуск? даже если он был 10 лет назад