Ученые разработали новую AI-модель для распознавания объектов: она может пригодиться незрячим пользователям

Тифлокомментарий: цветная фотография. Технология трехмерного распознавания лица. На темно-синем футуристичном фоне лицо молодой женщины со светлыми волосами чуть ниже плеч. У нее открытый лоб, спокойный прямой взгляд. Трехмерная модель лица заключена в виртуальный голубой прямоугольник с показателем загрузки программы. Лицо покрыто сетью тонких лазерных линий с десятками точек в ключевых местах идентификации.

Исследователи из Саудовской Аравии предложили новую AI-модель обнаружения объектов, которая в перспективе может упростить ориентацию в пространстве для людей с нарушением зрения.

Алгоритм на основе искусственного интеллекта позволяет распознавать предметы вокруг с точностью 99,69% — лучше, чем аналоги модели, — и может в будущем лечь в основу умных очков, браслетов или навигационных помощников.

Модель ODMVII-MOA (Object Detection Model for Visually Impaired Individuals with a Metaheuristic Optimization Algorithm) способна «видеть» даже слабо освещенные, частично закрытые или мелкие объекты.

В модели объединили сразу несколько технологий:

фильтрация изображения, которая позволяет убрать шум и повысить четкость;
нейросеть RetinaNet, которая распознает объекты;
система EfficientNetB0 — она извлекает максимум информации из картинки;
гибридная модель с «долгосрочной памятью», которая помогает системе понимать, что именно она «видит»;
алгоритм оптимизации, который помогает системе подстраиваться к разным условиям и сохранять точность.

Систему уже протестировали на большом наборе реальных изображений из помещений. Результаты оказались выше, чем у других — уже используемых — техник.

На основе новой модели можно создавать помощников, которые будут подсказывать пользователю, что находится вокруг.

Ранее мы писали о том, чат-бот GPT-4o научился в реальном времени вести диалог с пользователем и описывать полученные от него изображения.

Такая функция у нейросети есть также внутри приложения для помощи незрячим людям Be My Eyes.

Напоминаем, что за свежими новостями, интересными статьями и актуальными анонсами «Особого взгляда» удобно следить в нашем телеграм-канале. Приглашаем переходить по ссылке и становиться читателем. Подписывайтесь на нас также в «Дзене» и во «ВКонтакте».

Ученые разработали новую AI-модель для распознавания объектов: она может пригодиться незрячим пользователям

Хотите получать рассылку «Особый взгляд»?