Возвращаемся к задачке поимки жулика с виртуальной камерой.
Из нашей практики, жулики чаще всего пытаются подсунуть фотографию жертвы. Просто статичную фотографию. Это конечно же нужно детектировать с помощью анализа картинки: похожесть соседних кадров, проверка на линейное перемещение лендмарок лица, оптический поток.
Иногда они догадываются её немного анимировать, пустить по всей картинки эффект волн или подергать лицо. Простые проверки это обходит. Но вполне возможно самим нагенерировать таких эффектов и обучить сеть.
С дипфейками сложнее, тут игра в кошки-мышки, надежно и надолго выиграть не получится. Постоянно нужны ресурсы на дообучение.
Еще реже, но случаются ситуации когда жулик смог найти полноценное видео жертвы, например из соц сетей. В этом случае уже врядли анализ изображения сможет помочь - видео то настоящее.
К чему это всё? А к тому что есть ортогональный метод, не использующий изображение. Можно просить камеру изменить настройки (высота, ширина, fps) и замерять как быстро она это выполнит. Оказывается, физическая камера обрабатывает изменение характеристик дольше, чем виртуальная. И на этом можно обучить дерево-классификатор.
Дмитрий Гордин