Apple обучает компьютерные алгоритмы точному распознаванию изображений

Статья от специалистов Apple под названием "Распознавание объектов с помощью противопоставления искусственных и неопределённых изображений" была принята к рассмотрению и затем опубликована в библиотеке Корнелльского университета. Данная статья появилась менее чем через месяц после заявления компании Apple о том, что она больше не будет запрещать сотрудникам публиковать свои исследования в области искусственного интеллекта, и описывает технику тренировки компьютерного алгоритма, чтобы тот мог определять объекты с использованием искусственных или сгенерированных изображений.

По сравнению с тренировочными моделями, которые основываются только на реальных изображениях, искусственные данные такого рода зачастую более эффективны. К примеру, искусственное изображение глаза или руки уже снабжено соответствующими комментариями, а живые изображения этих объектов ещё не известны алгоритму - следовательно, должны быть предварительно описаны оператором. 

Однако в Apple отметили, что полагаться только лишь на искусственные изображения нельзя, так как они могут привести к неудовлетворительным результатам. Ведь компьютер может сгенерировать что-то недостаточно реалистичное, что не может послужить точным материалом для обучения. Для решения проблемы Apple предлагает усовершенствовать систему с помощью сочетания искусственных и неизвестных для сети изображений.

На практике такая система комбинирует немаркированные "живые" изображения с искусственными. Технология основана по большей части на генеративных состязательных сетях (GAN), которые используют две конкурирующие нейронные сети - генератор и дискриминатор - для отличия искусственных данных от реальных. Это довольно свежая разработка - метод успешно применяется в генерации фотореалистичных изображений.

Несмотря на то, что пока ничто не предвещает скорый выход подобной технологии в массы, Apple решила модифицировать GAN для распознавания взгляда и жестов. Компания выразила надежду, что подобная технология обучения однажды шагнёт от статичных картинок в сторону видео.

Первый публичный документ с исследованиями написан экспертом Ашишом Шриваставой и командой инженеров, включая Томаса Пфистера, Онселя Тузеля, Венда Ванга, Расса Уэбба и Джошуа Сасскинда, ведущего по исследованиями в области искусственного интеллекта Apple.

Нравится8
Комментарии (4)
B
i
u
Спойлер