Обучение компьютеров слежки за людьми
Обучение компьютера распознавать 3D фигуры людей на плоских изображениях – это главное занятие Deva Ramanan. На сервере Intel программа выдает результат работы распознавания видеозаписи Мишель Кван, видео которой транслируется на макбуке.
Программа, распознающая лица, умеет распознавать глаза-нос-рот, уже работает несколько лет.
Обнаружение человеческого тела – более сложная задача. С учетом всех положений, разнообразия поз, углов наклона и изгибов, роста и веса. Что бы программа распознавала людей, в память нужно забить миллионы фотографий. Дев Раманэн прибег к другому способу. Он обучает компьютер распознавать людей и их отдельные части по видео. Руки, ноги, туловище, компьютер запоминает различные позиции, изгибы. Обучение позволяет с меньшим количеством ресурсов и памяти определить человека, нежели с записью в память образов людей на много гигабайт памяти.
Раманэн приближает компьютер к возможностям человеческого мозга. Все свое время Дэв отдает обучению компьютера распознаванию человека, а так же чтению и пониманию контекста. Он считает, что его методы будут полезны для видеоигр, для обнаружения в автомобилях и пешеходного слежения. А чтение и понимание контекста приведет к тому, что компьютер сможет думать. Все его разработки могут привести к пониманию того, что делает человек. Компьютер сможет не просто определять: «вот нога», но и указать: «этот человек тушит пожар».
Комментарии