Новые ИИ-камеры делают выводы об увиденном со скоростью 8200 кадров в секунду

Высокоинтеллектуальные камеры скоро станут реальностью благодаря исследовательскому проекту университетов Бристоля и Манчестера. Ученые использовали свёрточные нейронные сети и разработали камеры, которые идентифицируют происходящее без необходимости в записи изображения.

Сейчас современные системы воспринимают и обрабатывают окружающий их мир недостаточно хорошо. Они по-прежнему комбинируют датчики для записи изображений (камеры) с вычислительными устройствами (графическими процессорами). В итоге системы ИИ воспринимают мир только после записи и передачи визуальной информации между датчиками и процессорами. Но многие вещи, которые камеры могут увидеть, часто не имеют отношения к поставленной задаче. Например детализация листьев на деревьях у дороги, по которой проезжает автомобиль с автопилотом. Сейчас вся эта ненужная информация фиксируется датчиками с мельчайшими подробностями и забивает систему нерелевантными данными, потребляя энергию и время обработки. Для обеспечения эффективного видения интеллектуальных машин необходим другой подход.

Два исследования Бристоля и Манчестера, показали, как можно объединить восприятие и обучение для создания новых камер для систем ИИ. Они представили свёрточную нейронную сеть (CNN) в системе технического зрения SCAMP-5D. Она способна классифицировать происходящее перед ней со скоростью 8 200 кадров в секунду. 

Сверточная нейронная сеть (CNN) в системе технического зрения SCAMP-5D, классифицирующая жесты рук со скоростью 8 200 кадров в секунду. Предоставлено: Бристольский университет

Напомним, свёрточная нейронная сеть — разновидность алгоритма ИИ. CNN, разработанные командой, могут распознавать изображения без необходимости записывать их или отправлять их дальше на системы обработки. 

Система технического зрения SCAMP-5d. Предоставлено: Манчестерский университет

Такой подход сделает системы гораздо более эффективными и безопасными, поскольку не нужно записывать изображения для их анализа.

Работа стала возможной благодаря архитектуре SCAMP, разработанной Петром Дудеком, профессором из Университета Манчестера, и его командой. SCAMP — это чип процессора камеры, который ученые описывают как массив пиксельного процессора (PPA). PPA имеет процессор, встроенный в каждый пиксель, который может взаимодействовать друг с другом для параллельной обработки данных. Это идеально подходит для CNN и алгоритмов зрения.

Разработка ученых представлена на Европейской конференции по компьютерному зрению (ECCV).

Источник: hightech.fm



Добавить комментарий