Microsoft Project Oxford более полугода открывает разработчикам всяческие интересные возможности. Например, на официальном сайте доступны бета-версии Face API – инструментов, определяющих по фотографии возраст, а также «идентифицирующих» личность (сравнивая две фотографии, компьютер устанавливает один ли и тот же это человек и выдает степень похожести). Теперь настал черед эмоций: Project Oxford определит, что на самом деле скрывается за вашим выражением лица.
Новый инструмент был представлен 11 ноября на конференции Future Decoded, проходившей на туманном Альбионе. Компьютерный алгоритм анализирует мимику и на этом основании выдает заключение о восьми основных эмоциональных состояниях: гневе, презрении, страхе, отвращении, счастье, печали, нейтральности или удивлении. Выражение этих чувств на лице оценивается дробным коэффициентом, максимум единицей.
Здесь можно протестировать детектор эмоций: фото открывается или перетаскивается из соответствующей папки на компьютере, либо в соответствующую строку вводится URL изображения. Требуется разрешение кадра не менее 36×36 пикселей, размер файла не должен превышать 4 МБ и для пущего эффекта желательно, чтобы человек был сфотографирован в анфас или около того. Поддерживаются форматы JPEG, PNG, GIF и BMP.
На сайте стоит пометка, что распознание является экспериментальным, и не всегда точно. Важное замечание, так как на инструмент распознания возраста в комментариях жаловалась молодежь, которой компьютер приписывал лишних лет (хотя автора сего материала Face Detection наоборот счел на 4 года младше, так что хороший инструмент))).
На поверку Project Oxford идентифицирует эмоции точнее, чем устанавливает возраст, правда при анализе большинства фотографий алгоритм выдает счастье и нейтральность. Так что есть вероятность к своему удивлению узнать, что в момент съемки вы были счастливы, даже если не подозревали об этом.
Microsoft сделала Emotion Recognition доступным для разработчиков в качестве публичной бета-версии. Как гласит блог компании, возможно, разработчики захотят использовать этот и другие инструменты для создания систем, оценивающих реакцию людей на товары и услуги. Или создать мессенджер с расширенным функционалом, основанным на распознании эмоций на фотографиях.
Среди других новых инструментов Microsoft значится усовершенствованная проверка орфографии, доступная уже сейчас. А к концу года появятся бета-версии инструментов анализа и редактирования видео, а также распознания речи, включая идентификацию по голосу и распознание речи в шумной обстановке.
Без сомнения, инструменты Microsoft Project Oxford будут востребованы среди разработчиков. Но, даже если вы к таковым не относитесь, интересно узнать, что компьютер выдаст о ваших эмоциях и что чувствовали важные для вас люди в момент фотографирования по мнению железной машины. Не правда ли?
Попробовал. Система сказала, что наибольшая вероятность — у эмоций «гнев» и «отвращение», хотя он улыбался во весь рот. Нужно дорабатывать.