Редактирование фотографий с помощью текста |  Пример вывода Apple MGIE, делающего закат более красным.

Работа Apple в области искусственного интеллекта, возможно, идет медленно, когда дело касается Siri, но компания не сидит сложа руки и ничего не делает. Компания только что выпустила модель искусственного интеллекта с открытым исходным кодом для редактирования фотографий с помощью простых текстовых команд – что было названо прорывным достижением.

Названный MGIE – для мультимодальной модели большого языка. Управляемое редактирование изображений – модель позволяет пользователю использовать естественный язык, чтобы сообщить редактору, чего вы хотите достичь…

Например, пользователь может просто сказать «сделай небо более синим», и MGIE интерпретирует это как «определите и выберите небо, а затем увеличьте насыщенность в этой области на 20 %».

VentureBeat сообщает, что MGIE способна выполнять впечатляющий спектр правок.

MGIE может выполнять стандартные операции редактирования в стиле Photoshop, такие как обрезка, изменение размера, вращение, переворачивание и добавление фильтров. Модель также может применять более сложные изменения, такие как изменение фона, добавление или удаление объектов и смешивание изображений.

MGIE может оптимизировать общее качество фотографии, например яркость, контрастность, резкость и цветовой баланс. Модель также может применять художественные эффекты, такие как рисование, рисование и карикатура.

MGIE может редактировать определенные области или объекты изображения, например лица, глаза, волосы, одежду и аксессуары. Модель также может изменять атрибуты этих областей или объектов, такие как форма, размер, цвет, текстура и стиль.

Если модель не дает ожидаемого результата, вы можете уточнить свой запрос или отменить эффект и дать другую инструкцию.

На данный момент это всего лишь модель с открытым исходным кодом на Github, но есть онлайн-демонстрация, которую вы можете использовать, чтобы загружать свои собственные изображения и играть с ней. Короткое знакомство с этим показывает, что это определенно ранняя бета-версия, но я определенно вижу потенциал.

Вот мое оригинальное фото:

Моя инструкция заключалась в том, чтобы «сделать небо немного более красным», что MGIE интерпретировало как «Сделайте небо на картинке оттенком красного, а не мерцающего синего». Сделайте городской пейзаж затененным, а не абсолютно белым небом». Вот результат (обрезанный по неизвестным причинам):

Хотя это непригодное для использования редактирование как есть (и демо-версия в любом случае поддерживает вывод только с очень низким разрешением), что для меня примечательно, так это то, как оно точно настраивает отражение на внутренней стороне металлической рамы, чтобы оно соответствовало небу. Это определенно показывает ранние обещания.

Мы пока не знаем, когда и сможет ли Apple добавить эту возможность в iPhone, как только он обеспечит более точные результаты, но это, безусловно, кажется очень логичным шагом для компании, которая всегда стремилась сделать функции AI-фотографии такими же автоматическими и простыми в использовании, как и возможный.

Редактирование фотографий с помощью текстовых команд — работа Apple AI продолжается

©