Искусственный интеллект распознает изображения хуже человека
У компьютерного зрения нет тех физиологических особенностей, которые есть у человека, поэтому оно хуже распознает изображения. К такому выводу пришли ученые из ВШЭ и Московского политехнического университета. Результаты исследования опубликованы в сборнике Proceedings of Seventh International Congress on Information and Communication Technology.
Чтобы понять, как машинное восприятие изображений отличается от человеческого, российские ученые загрузили изображения классических визуальных иллюзий в онлайн-сервис распознавания образов IBM Watson Visual Recognition. Большая часть из них представляла собой геометрические силуэты, частично скрытые геометрическими формами цвета заднего плана. Система пыталась определить, что представляет собой поступившее изображение, и указывала степень уверенности в своем ответе.
Оказалось, что искусственный интеллект не способен распознать ни одну воображаемую фигуру. Исключение составил раскрашенный воображаемый треугольник. В силу высокого контраста с фоном он был распознан правильно.
Владимир Винников
«Объекты, похожие на те, что мы использовали в ходе эксперимента, встречаются в реальной жизни, — комментирует автор исследования Владимир Винников, аналитик Научно-учебной лаборатории методов анализа больших данных факультета компьютерных наук ВШЭ. — Например, прицеп трейлера или радиобашня, которые по ночам обозначаются только габаритными огнями, автопилот автомобиля или самолета воспринимает таким же образом, как мы — воображаемые геометрические фигуры».
Человеческий глаз постоянно непроизвольно движется, а светочувствительная поверхность его сетчатки имеет форму полусферы. Чтобы человек увидел иллюзию, изображению достаточно быть векторным — состоять из опорных точек и соединяющих их кривых. Человеческое воображение достроит картинку благодаря физиологической особенности зрения — постоянному движению глаз.
В оптико-электронных системах все устроено иначе. Их светочувствительная матрица имеет плоскую, как правило прямоугольную, форму, а сама система линз далеко не так свободна в движении, как человеческий глаз. Поэтому искусственный интеллект не может достроить воображаемые линии, которые связывают фрагменты геометрической иллюзии. Машинное зрение видит только то, что реально изображено, тогда как человек достраивает в воображении полное изображение по его очертаниям.
Нейросетевые системы распознавания образов сегодня активно распространяются в коммерческом секторе. Однако вопрос, насколько точно машина распознает изображение, до сих остается открытым. От точности его распознавания могут зависеть человеческие жизни. Например, если автопилот автомобиля или самолета не распознает объект с низкой контрастностью относительно фона и не успеет вовремя уклониться от препятствия, может произойти катастрофа.
Ученые полагают, что недостатки машинного распознавания образов можно исправить.
Например, дополнить распознавание растровых изображений, представляющих собой сетку пикселей, имитацией физиологических особенностей движения глаз, которые позволяют глазу видеть двумерные и трехмерные сцены. Альтернативный способ — добавить векторное описание изображений. Оно позволит запрограммировать машину на обход изображения по траекториям, заданным векторами.
«Воображаемые фигуры обязательно стоит использовать в качестве тестов в системах, которые зависят от распознавания фото- и видеопотоков. Например, в автопилотах машин или беспилотных летательных аппаратов. Это поможет избежать рисков, связанных с использованием систем машинного интеллекта в промышленности и транспортных системах», — полагает Владимир Винников.
Вам также может быть интересно:
«Когда мир стремительно меняется, важно искать инструменты управления изменениями»
В начале апреля в Высшей школе экономики в Москве состоялась XIX Всероссийская научная конференция с международным участием «Параллельные вычислительные технологии» (ПаВТ). Конференция ПаВТ — ежегодное научное мероприятие, которое проводится в крупных научных центрах России. Форум в НИУ ВШЭ объединил более 200 ученых из пяти стран. Участники конференции представляли 55 организаций из 28 городов, в том числе 15 институтов РАН и НИИ, 30 университетов, 8 предприятий ИТ-индустрии и 2 промышленных предприятия.
ВШЭ — лидер конкурсного отбора Минцифры России по подготовке кадров в области ИИ
Министерство цифрового развития, связи и массовых коммуникаций Российской Федерации и Аналитический центр при Правительстве РФ завершили конкурсный отбор вузов, которые в 2025–2030 годах займутся подготовкой специалистов в сфере искусственного интеллекта. По итогам конкурсного отбора по программам высшего уровня «ТОП ДС» первое место заняла Высшая школа экономики.
Искусственный интеллект помогает точнее прогнозировать риски сложных заболеваний
Разработанные в Центре искусственного интеллекта НИУ ВШЭ нейросетевые модели значительно улучшают прогнозирование риска ожирения, диабета первого типа, псориаза и других многофакторных заболеваний. Совместное исследование с компанией Genotek показало, что алгоритмы глубокого обучения эффективнее традиционных методов, особенно при сложных взаимодействиях генов (эпистазах). Результаты опубликованы в журнале Frontiers in Medicine.
Искусственный интеллект может стать катализатором устойчивого развития
Искусственный интеллект трансформирует все сферы жизни, расширяя наши возможности и границы. В то же время технологии бросают человечеству новые вызовы, связанные с безопасностью, этикой и защитой окружающей среды. На сегодняшний день каждая нейросеть оставляет за собой большой углеродный след. Однако при грамотном управлении ИИ может принести пользу планете и стать залогом устойчивой экономики будущего. Об этом рассказал научный руководитель Лаборатории алгоритмов и технологий анализа сетевых структур НИУ ВШЭ в Нижнем Новгороде Панос Пардалос в рамках XXV Ясинской (Апрельской) международной научной конференции по проблемам развития экономики и общества.
В Вышке создали собственную MLOps-платформу
Ученые НИУ ВШЭ создали MLOps-платформу SmartMLOps. Она предназначена для исследователей в области искусственного интеллекта, которые хотели бы превратить свое изобретение в полноценный сервис. В будущем на платформе могут быть развернуты ИИ-помощники для упрощения образовательного процесса, оказания медицинской помощи, консультирования и решения многих других задач. Создатели ИИ-технологий смогут получить готовый к работе сервис в течение считанных часов. На суперкомпьютере Вышки этот сервис может быть запущен в несколько кликов.
«От нашей общей работы зависит будущее»: что несет человечеству развитие ИИ
Какие перспективы и вызовы для человечества несет развитие технологий искусственного интеллекта? Как его используют ученые? Каким будет мир, где доминирует ИИ? Эти и другие темы обсудили эксперты на форсайт-сессии «Будущее исследований в сфере искусственного интеллекта», которая прошла в НИУ ВШЭ.
ИИ позволит точно моделировать производительность систем хранения данных
Исследователи факультета компьютерных наук НИУ ВШЭ разработали новый подход к моделированию систем хранения данных на основе генеративных моделей машинного обучения. Он позволяет с высокой точностью предсказывать ключевые характеристики работы таких систем при различных условиях. Результаты опубликованы в журнале IEEE Access.
ИИ в образовании: как преодолеть соблазн готовых решений
Искусственный интеллект уже стал обыденностью для молодежи: как показал опрос, около 87% студентов ведущих вузов используют ИИ в процессе обучения. Большая часть из них отметила, что он помогает им экономить время, при этом они проверяют сделанную ИИ работу. Результаты исследования были представлены на конференции по анализу данных и технологиям ИИ Data Fusion. В ее работе приняли участие научный руководитель НИУ ВШЭ Ярослав Кузьминов и другие эксперты Вышки.
Большинство студентов не верят, что ИИ сможет заменить их на работе
Большинство студентов считают, что ИИ не сможет заменить их на работе в ближайшие десять лет. Низким такой риск называют 27,2% респондентов, 41,5% — крайне маловероятным. Эти оценки были получены НИУ ВШЭ в ходе опроса 4200 студентов в 2025 году. Они приводятся в докладе «Эпоха больших языковых моделей: почему они все еще не профессионалы», подготовленном научным руководителем НИУ ВШЭ Ярославом Кузьминовым и старшим преподавателем кафедры высшей математики НИУ ВШЭ Екатериной Кручинской. Доклад был представлен на XXV Ясинской (Апрельской) международной научной конференции по проблемам развития экономики и общества, которая проходит с 15 по 18 апреля в НИУ ВШЭ.
Точный ИИ-оракул: какие тренды интересуют бизнес
Современные технологии ежедневно меняют мир, автоматизируя бизнес-процессы в различных отраслях. Специалисты НИУ ВШЭ представили масштабный опыт команды iFORA по реализации ИИ-проектов в интересах крупных компаний и органов власти.