Нативная генерация изображений ИИ пришла в ChatGPT.

С последним обновлением ChatGPT интегрировал нативные возможности создания изображений с помощью GPT-4, что позволяет обеспечивать точные мультимодальные ответы, одновременно являясь интересными и этичными.


🚀 Хочешь улететь на Луну вместе с нами? Подписывайся на CryptoMoon! 💸 Новости крипты, аналитика и прогнозы, которые дадут твоему кошельку ракетный ускоритель! 📈 Нажмите здесь: 👇

CryptoMoon Telegram


В настоящее время системы искусственного интеллекта по всему миру постоянно развиваются. Ведущие игроки в секторе ИИ усердно работают над внедрением обновлений и новых функций для множества систем искусственного интеллекта. ChatGPT от OpenAI не является исключением из этой тенденции. Совсем недавно компания предоставила своему чат-боту возможность генерировать изображения с помощью технологий AI.

Благодаря этой предстоящей функции возможности ChatGPT значительно расширятся. Это инновационное дополнение использует передовую модель GPT-4o, позволяя пользователям создавать изображения прямо в рамках платформы ChatGPT.

Действительно, данное развитие является многообещающим с точки зрения технологического прогресса. Однако крайне важно исследовать различные аспекты этого процесса. Например, вопросы доступности, этики и креативности, вдохновленной искусственным интеллектом, остаются без ответа. Для лучшего понимания ситуации будет полезно принять участие в конструктивных дискуссиях по данным темам. Не беспокойтесь, мы намерены затронуть все эти моменты в нашей следующей публикации. Поэтому приготовьтесь и давайте углубимся в детали!

Основные особенности создания изображений искусственным интеллектом в ChatGPT

Благодаря добавлению многосторонних способностей модель GPT-4o теперь способна создавать живые изображения. Эти изображения создаются в ответ на инструкции пользователя и по уровню детализации соответствуют тем указаниям, которые были предоставлены.

Между GPT-4o и его предшественником DALL-E существует существенное различие: в то время как DALL-E способен управлять лишь до 8 объектами на изображении, GPT-4o может обрабатывать до 20 объектов. Это обновление символизирует значительное продвижение по сравнению с другими моделями в данной области. Кроме того, пользователи могут загружать изображения для модификации и улучшения AI моделью. Эта возможность демонстрирует гибкость ChatGPT при решении творческих задач.

Главная идея здесь заключается в том, что OpenAI утверждает, что модель способна точно генерировать текст, следовать инструкциям и минимизировать нежелательные результаты. Эта точность достигается благодаря обучению модели на совместном распределении интернет-изображений и текстов. Цель этого процесса обучения — помочь модели эффективно понимать связи между визуальным контентом и языком.

Ограничения и этические гарантии

Несмотря на значительные возможности GPT-40 для модели ИИ, OpenAI признает, что она не безупречна. Компания активно стремится улучшить и преодолеть естественные ограничения генерации изображений в рамках ChatGPT, которые ожидаются быть устранены с помощью будущих обновлений.

По сути, как гласит старинная мудрость: ‘Сила несет в себе тяжкую ношу’. Крайне важно внедрить строгие этические нормы для предотвращения злоупотреблений при работе с передовыми технологиями искусственного интеллекта. Например, OpenAI взяла этот подход на вооружение, запрещая создание вредоносного контента вроде материалов сексуального характера с участием детей (CSAM) и дипфейков с явным сексуальным подтекстом. Более того, они включили метаданные C2PA в каждое генерируемое изображение для обеспечения точной идентификации созданных искусственным интеллектом изображений.

В ответ на обсуждения по созданию изображений с участием взрослых публичных персон компания OpenAI предприняла значительные шаги для решения этой проблемы, подчеркнув сложность сохранения свободы творчества при одновременном учете вопросов конфиденциальности. Следует отметить, что было сделано обновление о том, что взрослые публичные персоны могут попросить исключить себя из любых изображений, генерируемых GP3-4o.

Доступность и Доступность

Изначально возможность генерировать изображения с помощью AI в ChatGPT была доступна для пользователей Plus, Pro, Team и даже для бесплатных. К сожалению, из-за чрезвычайно высокого спроса на эту функцию генеральный директор OpenAI Сэм Альтман объявил о невозможности удовлетворить спрос в настоящий момент.

Согласно посту Сэма Альтмана на X (ранее известном как Twitter), изображения в ChatGPT приобрели гораздо большую популярность, чем ожидалось, даже превзошли наши первоначальные высокие ожидания. К сожалению, выпуск этой функции для бесплатного уровня потребует некоторого времени.

В связи с недавними изменениями, компания OpenAI временно прекратила предоставление доступа пользователям без подписки и ограничила создание определённых видов контента, например, изображений в стиле Studio Ghibli, подобно тому, как это происходило при запуске персонажа Соры.

Пока не было официальной декларации о дневном лимите использования для владельцев бесплатных аккаунтов. Тем не менее, представительница OpenAI Тайа Кристинсон рассказала The Verge, что ограничение на использование для бесплатной версии схоже с DALL-E (трижды в день). Также стоит отметить, что они намекнули на возможные изменения по этому поводу.

не могли назвать точное число, и они могут изменяться со временем в зависимости от спроса.

Последствия будущего генерации изображений ИИ

Включение нативной генерации изображений ИИ среди функций ChatGPT означает значительный скачок вперед в способности искусственного интеллекта смешивать текст с креативными визуальными материалами. В отличие от DALL-E, интеграция GPT-4o в ChatGPT обеспечивает более плавные и адаптивные взаимодействия с искусственным интеллектом. По мере того как OpenAI продолжает разрабатывать новые технологии при обеспечении адекватных мер против злоупотребления ими, наш прогресс кажется многообещающим.

Смотрите также

2025-03-29 14:52