Компанія Fujitsu і її американський підрозділ у співпраці зі Школою комп’ютерних наук Університету Карнегі-Меллона розробили технологію розпізнавання виразу обличчя на основі ІІ.
«Технологія може точно виявляти ледь вловимі емоційні зміни, в тому числі нервову посмішку, збентеження і т. Д. Fujitsu розраховує, що нова технологія знайде застосування в різних додатках, пов’язаних у тому числі з безпекою», – оголошено в прес-релізі.
Як відзначають в компанії, технології, пов’язані з виявленням змін виразу обличчя і «читанням» людських емоцій, в основному, були розроблені для виявлення явних змін – таких як: широка посмішка або широко розкриті очі. Щоб ефективніше «читати» людські обличчя, важливо фіксувати тонкі зміни, пов’язані з такими емоціями, як нерозуміння, здивування і стрес, впевнені в Fujitsu.
Для досягнення цієї мети розробники в компанії використовували так звані одиниці дії (Action Units, AU), які відповідають певному руху кожної м’язи обличчя. Існує приблизно 30 типів AU на основі рухів кожної лицьової м’язи. Наприклад, якщо ІІ зауважує одночасно два AU – «рух щоки вгору» і «підйом кута губ», – ІІ може зробити висновок, що людина радий.
«Інтегрувавши цей AU в свою технологію, Fujitsu змогла домогтися виявлення навіть незначних змін у виразі обличчя», – стверджують в компанії.
Щоб виявляти AU з більшою точністю, базові методи глибокого навчання вимагають великих обсягів даних. Однак в реальних ситуаціях камери зазвичай фіксують особи під різними кутами і з різної відстані, що ускладнює створення дійсно великих баз даних для навчання.
«Проблема з сьогоднішньою технологією полягає в тому, що ІІ повинен навчатися на величезних наборах даних для кожного AU. Він повинен знати, як розпізнавати той чи інший AU зі всіх можливих кутів і позицій. Але ми не робимо цього », – заявив представник Fujitsu в коментарі виданню ZDNet.
В процесі навчання штучного інтелекту Fujitsu розробила технологію адаптації для кожного зображення особи. Наприклад, коли особа сфотографована під кутом, технологія може підлаштовувати зображення, щоб воно було більше схоже на фронтальне. За допомогою цієї технології фотографії осіб повертаються, збільшуються або зменшуються. Це дозволяє навчати ІІ, маючи в своєму розпорядженні відносно невеликий обсяг даних.
Як стверджують в Fujitsu, нова технологія досягла високої точності розпізнавання виразів облич – 81% навіть при обмежених даних для навчання.
Подібною технологією, як пише Unirobotica, володіє і Microsoft. Однак її інструмент ІІ здатний розпізнавати тільки вісім основних емоцій – гнів, презирство, страх, відраза, щастя, печаль, здивування або нейтральний вираз обличчя. При цьому точність визначення емоцій у інструменту Microsoft склала 60%.