Нейросети в обработке видео: Мифы и реальность
Дмитрий Ватолин. Проект VQMT3D
В последнее время вдохновляющие новости о новых фантастических достижениях нейросетей регулярно раздаются из каждого чайника.
При этом хор скептиков, людей попробовавших и разочаровавшихся в теме тоже становится все сильнее, более того — все больше тех, кто старается погасить хайп вокруг нейросетей именно среди занимающихся ими профессионалов.
О чем пойдет речь:
- В чем заключается главная сложность оценки качества работы нейросетевых подходов?
- В чем нейросети сильны? В чем они слабы?
- Как развивается новые методы маттинга (кеинга) на основе нейросетей и насколько они лучше традиционных подходов?
- Насколько велика роль методов распознавания в современных алгоритмах обработки видео и как это будет выглядеть завтра?
В конце будет представлены результаты прямого соревнования людей и роботов, проведенного нами!
У квадратных картинок был удален центральный квадрат (1/9 площади, 11% картинки) и мы дали восстановить удаленный фрагмент:
- 3-м фрилансерам, которые должны были потратить не более 90 минут
- 7-ми нейросетевым алгоритмам
- и 4-м старым добрым “обычным” подходам (в том числе из Photoshop)
И далее дали 215 людям вслепую (не зная где какой результат) оценить, кто лучше. Сравнение с фрилансерами было на 3-х картинках, сравнение алгоритмов на 33 картинках.
Две очевидных интриги кто лучше:
- Нейросети или люди?
- Нейросети или “старые” подходы?
Изображения были довольно сложные, вот результаты людей:
Результаты, а также удачные и неудачные примеры работы нейросетевых и “обычных” подходов будут предъявлены.
90 минут работы человека или одно нажатие???
Скоро профессиональные “фотожабы” станут доступны каждому школьнику???
Будущее уже наступило, просто оно не очень равномерно распределено )))
Автор.
Дмитрий Ватолин, проект VQMT3D
|| AI, CG EVENT MOSCOW 2018, Compositing&VFX, hit, hiteng