сен

2024

Красота в деталях: ученые Вышки и AIRI разработали метод высококачественного редактирования изображений

Энди Уорхол. Диптих Мэрилин, 1962г.

crossarea.ru/art

Исследователи Центра ИИ НИУ ВШЭ, AIRI и Бременского университета разработали новый метод редактирования изображений на основе глубинного обучения — StyleFeatureEditor. Он позволяет точно воссоздавать мельчайшие детали изображения и сохранять их при редактировании. С его помощью пользователи смогут изменять цвет волос или выражение лица без потери качества изображения. Результаты работы опубликованы на самой цитируемой конференции по компьютерному зрению CVPR 2024.

Искусственный интеллект уже научился генерировать изображения и редактировать их. Это стало возможным благодаря генеративно-состязательным нейросетям (GANs — generative adversarial networks). Архитектура предполагает две независимые сети: генератор производит изображения, дискриминатор различает реальные и сгенерированные образцы, и они соревнуются друг с другом. Новым этапом в развитии генеративно-состязательных сетей стала модель StyleGAN. Она может генерировать изображения и изменять их отдельные части по запросу пользователя, но не умеет работать с реальными фото или картинками.

Исследователи Центра ИИ НИУ ВШЭ, AIRI и Бременского университета предложили способ быстро и качественно редактировать реальные изображения. Ученые создали метод (StyleFeatureEditor) с двумя модулями: первый воссоздает (реконструирует) исходное изображение, а второй редактирует эту реконструкцию. Результат работы модулей передается в StyleGAN в понятном для нейросети наборе внутренних представлений, из которых и создается редактированное изображение. При этом разработчикам удалось решить проблемы, которые возникали в предыдущих исследованиях: при небольшом наборе представлений нейросеть хорошо редактировала изображение, но теряла детали исходного изображения, а при большом наборе все детали сохранялись, но нейросеть не понимала, как их правильно преобразовать с учетом поставленной задачи.

Для решения этой проблемы исследователи предложили следующее: первый модуль ищет и большие, и маленькие представления, а второй учится редактировать большие на примере редактуры маленьких представлений.

Однако, чтобы обучить эти модули правильно редактировать представления, нейросети нужны настоящие изображения и их отредактированные версии.

Денис Бобков

«Нам нужны были образцы, например одно и то же лицо с разной мимикой, прической, деталями. К сожалению, таких пар изображений не существует на данный момент. И мы придумали хитрость: с помощью метода, работающего с малыми представлениями, мы создали реконструкцию настоящего изображения и пример редактирования этой реконструкции. Несмотря на то что получились довольно простые примеры без деталей, модель четко поняла, как правильно совершать редактирования», — рассказывает один из авторов статьи, стажер-исследователь Центра глубинного обучения и байесовских методов Института искусственного интеллекта и цифровых наук ФКН, младший научный сотрудник лаборатории Fusion Brain AIRI Денис Бобков.

Однако обучение только на сгенерированных (простых) примерах ведет к потере деталей при работе с реальными (сложными) изображениями. Чтобы этого не происходило, ученые добавили реальные изображения в обучающую выборку. И нейросеть училась воссоздавать их в деталях.

Таким образом, показав модели и как редактировать простые, и как воссоздавать сложные изображения, ученым удалось создать условия, при которых нейросеть научилась редактировать сложные изображения. В частности, разработанный подход справляется с добавлением новых элементов стиля, а также лучше сохраняет детали исходных изображений по сравнению с другими существующими методами.

В случае простой реконструкции (первый ряд) StyleFeatureEditor аккуратно воспроизвел шляпку, в то время как большинство других методов ее практически потеряло. Лучшее качество разработанный метод показал в случае добавления аксессуаров (третий ряд): большинство методов справились с добавлением очков, но только StyleFeatureEditor сохранил исходный цвет глаз.

Айбек Аланов

«Благодаря технике обучения на сгенерированных данных, мы получили модель с хорошим качеством редактирования, а также быструю скорость работы за счет использования подхода с достаточно легковесными нейросетями. Фреймворку StyleFeatureEditor требуется всего 0,07 секунды на редактирование одного изображения», — говорит Айбек Аланов, заведующий Центром глубинного обучения и байесовских методов Института искусственного интеллекта и цифровых наук ФКН, руководитель научной группы «Контролируемый генеративный ИИ» лаборатории Fusion Brain AIRI.

Исследование поддержано грантом для исследовательских центров в области искусственного интеллекта, предоставленным Аналитическим центром при Правительстве РФ.

Результаты исследования будут представлены в докладе на ежегодной конференция по искусственному интеллекту и машинному обучению Fall into ML 2024, которая пройдет в НИУ ВШЭ 25-26 октября. На площадке Высшей школы экономики ведущие ученые в области искусственного интеллекта обсудят лучшие работы, опубликованные на конференциях А* в 2024 году — флагманских событиях этой области. Демо разработанного метода можно опробовать на HuggingFace, код — в Github репозитории.

Дата

5 сентября 2024

Рубрики

Наука

Темы

исследования и аналитика искусственный интеллект нейросети

В статье упомянуты

Институт искусственного интеллекта и цифровых наук, Центр глубинного обучения и байесовских методов, Центр искусственного интеллекта

Персоны

Аланов Айбек

Бобков Денис Николаевич

Вам также может быть интересно:

июл

2025

Рекомендательные системы: новые алгоритмы и современная практика

Институт ИИ и цифровых наук ФКН НИУ ВШЭ провел конференцию, посвященную передовым технологиям рекомендательных систем. Мероприятие прошло в атмосфере активного обмена опытом между ведущими специалистами отрасли и позволило участникам ознакомиться с последними достижениями и практическими решениями в области разработки рекомендательных моделей.

3 июля

июн

2025

ИИ в университетах: раскрытие потенциала и преодоление тревог

Образовательные ИИ-инструменты заметно эволюционировали, однако до сих пор многие представители университетов и рядовые пользователи испытывают опасения на их счет. Ученые Института образования НИУ ВШЭ изучили различные аспекты интеграции искусственного интеллекта в образовательный процесс и объединили усилия с ИТ-компанией «Кеды профессора», чтобы помогать российским вузам встраивать ИИ-решения в свою работу.

27 июня

мая

2025

«ИИ и машинное обучение — мощные технологии, но не везде научились их применять»

Рост доходов мировой индустрии образования может составить до 4% в ближайшие годы благодаря внедрению технологий искусственного интеллекта. Кроме того, ИИ сокращает время работы преподавателей в 4–5 раз. Эксперты Вышки рассказали, как преподаватели и административный персонал вузов осваивают нейросети, боты и другие инструменты и почему не стоит бояться, что их заменит ИИ.

30 мая

мая

2025

Онлайн-кампус НИУ ВШЭ стал лауреатом премии «AI Олимп»

«AI Олимп» оценивает разработки в области искусственного интеллекта и является продолжением проекта Digital Leaders, который более 10 лет освещает лучшие достижения в области цифровизации, онлайн-сервисов и диджитал-решений.Онлайн-кампус НИУ ВШЭ стал победителем номинации «Платформа года» в категории «Персонализированные обучающие платформы». Среди лауреатов премии — Сбер, «Гемотэк», RuStore, «Норникель», «Авито» и другие крупные компании.

28 мая

мая

2025

Меньше половины пиарщиков сообщают клиентам, что пользуются ИИ

Центр медиапрактик Высшей школы экономики совместно с АКОС подготовил исследование о том, как российские пиарщики пользуются искусственным интеллектом. Большинство респондентов оценивают работу с нейросетями как эффективную и считают, что использование ИИ улучшило качество их работы.

21 мая

мая

2025

В НИУ ВШЭ будет создан Центр подготовки кадров для ИТ-отрасли

Минцифры России совместно с Аналитическим центром при Правительстве России подвели итоги конкурсного отбора вузов для получения грантов на запуск углубленного ИТ-образования. Заявки на конкурс подали 50 вузов, определены 26 победителей из 13 регионов, в том числе Высшая школа экономики.

13 мая

мая

2025

Сервисы должны быть гибкими: как использовать искусственный интеллект государству

Международная лаборатория цифровой трансформации в государственном управлении НИУ ВШЭ провела круглый стол «Искусственный интеллект в государственном управлении: современные тенденции». Какие сервисы улучшит ИИ и что важно учитывать, применяя новые технологии, рассказали российские и зарубежные ученые.

7 мая

апр

2025

«Когда мир стремительно меняется, важно искать инструменты управления изменениями»

В начале апреля в Высшей школе экономики в Москве состоялась XIX Всероссийская научная конференция с международным участием «Параллельные вычислительные технологии» (ПаВТ). Конференция ПаВТ — ежегодное научное мероприятие, которое проводится в крупных научных центрах России. Форум в НИУ ВШЭ объединил более 200 ученых из пяти стран. Участники конференции представляли 55 организаций из 28 городов, в том числе 15 институтов РАН и НИИ, 30 университетов, 8 предприятий ИТ-индустрии и 2 промышленных предприятия.

30 апреля

апр

2025

ВШЭ — лидер конкурсного отбора Минцифры России по подготовке кадров в области ИИ

Министерство цифрового развития, связи и массовых коммуникаций Российской Федерации и Аналитический центр при Правительстве РФ завершили конкурсный отбор вузов, которые в 2025–2030 годах займутся подготовкой специалистов в сфере искусственного интеллекта. По итогам конкурсного отбора по программам высшего уровня «ТОП ДС» первое место заняла Высшая школа экономики.

30 апреля

апр

2025

Искусственный интеллект помогает точнее прогнозировать риски сложных заболеваний

Разработанные в Центре искусственного интеллекта НИУ ВШЭ нейросетевые модели значительно улучшают прогнозирование риска ожирения, диабета первого типа, псориаза и других многофакторных заболеваний. Совместное исследование с компанией Genotek показало, что алгоритмы глубокого обучения эффективнее традиционных методов, особенно при сложных взаимодействиях генов (эпистазах). Результаты опубликованы в журнале Frontiers in Medicine.

30 апреля