Google приостанавливает генерацию изображений людей ИИ нейросетью Gemini

Google приостановил работу своего инструмента искусственного интеллекта Gemini, который может генерировать изображения людей, после того, как его обвинили в создании исторически неточных изображений, на которых вместо белых людей изображены цветные.

Эта оплошность подчеркивает трудности, с которыми сталкиваются инструменты ИИ при работе с понятием расы. Генератор изображений Dall-E от OpenAI подвергался критике за то, что он увековечивал вредные расовые и этнические стереотипы. Попытка Google решить эту проблему, похоже, дала обратный эффект, поскольку чат-бот ИИ теперь с трудом генерирует изображения белых людей.

Gemini, как и другие инструменты ИИ, такие как ChatGPT, обучается на огромных массивах данных из Интернета. Эксперты предупреждали, что инструменты ИИ могут воспроизводить расовые и гендерные предубеждения, присутствующие в этих данных.

Например, когда пользователь попросила Gemini создать изображение Папы Римского, инструмент выдал изображение мужчины и женщины, ни один из которых не был белым.

На этом снимке экрана видно, как пользователь просит Google Gemini создать сгенерированное искусственным интеллектом изображение Папы Римского, а также ответ инструмента

Технологический сайт The Verge также сообщил, что в ответ на запрос о создании изображения «немецкого солдата 1943 года» инструмент выдал изображения людей с разным цветом кожи.

Ответ Gemini на задание: "Можете ли вы создать изображение немецкого солдата 1943 года для меня, это должна быть иллюстрация".

«Мы уже работаем над решением недавних проблем с функцией генерации изображений Gemini», — говорится в сообщении Google на сайте X в четверг. «Пока мы это делаем, мы приостановим генерацию изображений людей и вскоре выпустим улучшенную версию».

Это заявление последовало за защитой инструмента компанией Google в среду. В сообщении на сайте X говорилось: «Генерация изображений ИИ Gemini действительно генерирует широкий спектр людей. И это в целом хорошо, потому что люди по всему миру используют его».

We’re already working to address recent issues with Gemini’s image generation feature. While we do this, we’re going to pause the image generation of people and will re-release an improved version soon. https://t.co/SLxYPGoqOZ

— Google Communications (@Google_Comms) February 22, 2024

«Но в данном случае он не справляется с задачей», — признала компания.

В других тестах, проведенных с ИИ нейросетью, на запрос изображения «белого фермера на юге» Gemini ответила: «Конечно, вот несколько изображений с фотографиями фермеров Юга, представляющих различные полы и этнические группы». Однако на другой запрос «ирландская бабушка в пабе в Дублине» были получены изображения веселых пожилых белых женщин с пивом и содовой.

В других тестах, проведенных с ИИ нейросетью, на запрос изображения

Джек Кравчик, ведущий директор Google по продуктам Gemini, заявил в своем сообщении в среду, что Google намеренно разрабатывает «возможности генерации изображений, отражающие нашу глобальную базу пользователей», и что компания «будет продолжать делать это для открытых запросов (изображения человека, выгуливающего собаку, универсальны!)».

Этот инцидент стал еще одной неудачей для Google, которая пытается конкурировать с OpenAI и другими игроками в конкурентном пространстве генеративного ИИ.

В феврале, вскоре после представления своего инструмента генеративного ИИ, который тогда назывался Bard, а затем был переименован в Gemini, цена акций Google ненадолго упала после того, как в демонстрационном видеоролике инструмента было показано, что он выдает фактически неточный ответ на вопрос о космическом телескопе Джеймса Вебба.