Исследователи из Саудовской Аравии предложили новую AI-модель обнаружения объектов, которая в перспективе может упростить ориентацию в пространстве для людей с нарушением зрения.
Алгоритм на основе искусственного интеллекта позволяет распознавать предметы вокруг с точностью 99,69% — лучше, чем аналоги модели, — и может в будущем лечь в основу умных очков, браслетов или навигационных помощников.
Модель ODMVII-MOA (Object Detection Model for Visually Impaired Individuals with a Metaheuristic Optimization Algorithm) способна «видеть» даже слабо освещенные, частично закрытые или мелкие объекты.
В модели объединили сразу несколько технологий:
-
фильтрация изображения, которая позволяет убрать шум и повысить четкость;
-
нейросеть RetinaNet, которая распознает объекты;
-
система EfficientNetB0 — она извлекает максимум информации из картинки;
-
гибридная модель с «долгосрочной памятью», которая помогает системе понимать, что именно она «видит»;
-
алгоритм оптимизации, который помогает системе подстраиваться к разным условиям и сохранять точность.
Систему уже протестировали на большом наборе реальных изображений из помещений. Результаты оказались выше, чем у других — уже используемых — техник.
На основе новой модели можно создавать помощников, которые будут подсказывать пользователю, что находится вокруг.
Ранее мы писали о том, чат-бот GPT-4o научился в реальном времени вести диалог с пользователем и описывать полученные от него изображения.
Такая функция у нейросети есть также внутри приложения для помощи незрячим людям Be My Eyes.
Напоминаем, что за свежими новостями, интересными статьями и актуальными анонсами «Особого взгляда» удобно следить в нашем телеграм-канале. Приглашаем переходить по ссылке и становиться читателем. Подписывайтесь на нас также в «Дзене» и во «ВКонтакте».