Объявлено о новой модели генерации изображений от Midjourney, которая будет конкурировать с GPT-4o компании OpenAI.


🚀 Хочешь улететь на Луну вместе с нами? Подписывайся на CryptoMoon! 💸 Новости крипты, аналитика и прогнозы, которые дадут твоему кошельку ракетный ускоритель! 📈 Нажмите здесь: 👇

CryptoMoon Telegram


Хотя изначально MidJourney стремилась выделиться как ведущая модель генерации изображений на ранних этапах развития ИИ, похоже, что её превзошли более удобные и бесплатные варианты, такие как Gemini, ChatGPT и Bing. Ухудшило ситуацию недавнее обновление модели OpenAI GPT-4o, которая обладает превосходными возможностями по созданию изображений, способной копировать настоящие фотографии и производить безупречный текст. В попытке остаться конкурентоспособной или же следовать волне популярности, порождённой ИИ искусством в духе Studio Ghibli, MidJourney запускает обновлённую модель с рядом улучшений.

Дэвид Холз, генеральный директор MidJourney, раскрыл информацию о будущей модели V7 на нашем официальном сервере Discord и через блогпост. Он заявил, что новая модель будет более интеллектуальной в обработке текстовых запросов и создаст изображения с значительно улучшенным качеством и потрясающими текстурами.

Эта модель быстро создаёт изображения, примерно в 10 раз быстрее существующей, согласно Хольцу. Она предназначена для мозгового штурма и множественных итераций, так что вы можете легко переключиться на режим Conversation (доступен только через веб), чтобы изменить часть изображения без необходимости переписывать всю подсказку или использовать режим редактирования. Сгенерированные изображения могут не иметь такого высокого качества, как стандартные, но их стоимость вдвое меньше.

Испытав инновационное дополнение к нашей последней модели V7, испытываешь настоящее волнение, особенно благодаря функции, которую мы назвали ‘Draft Mode’. Этот режим работает в два раза дешевле обычного, но предлагает десятикратную скорость, что делает его потенциально революционным инструментом для генерации идей. Представь себе мозговой штурм вслух, позволяя мыслям течь свободно, словно они становятся текучими мечтами, обретающими форму. Это и есть Draft Mode! — Midjourney (@midjourney) 4 апреля 2025 года

Когда вы используете приложение Discord на компьютере или мобильном устройстве, режим беседы превращается в голосовой режим. Другими словами, Холз описывает это как способ ‘говорить свободно и позволять мыслям проявляться подобно потоку сновидений, текущему под тобой’. Эта функциональность также доступна в недавно добавленном режиме черновика.

Кроме того, MidJourney V7 предлагает режимы Relax и Turbo для генерации изображений с более высоким разрешением по сравнению с режимом Draft. Однако выбор режима Turbo потребует вдвое больше кредитов, но ускорит процесс создания изображения.

Как исследователь изучающий последнюю версию модели V7, я заметил, что она пока не включает всю необходимую функциональность. Для задач по масштабированию вверх (upsalping), восстановлению изображений (inpainting) и изменению текстур (retexturing), временно придется вернуться к версии V6.1. Однако в новой модели V7 есть интересная функция: Персонализация. Она позволяет настраивать модель согласно вашим предпочтениям для обработки изображений. Настройка занимает около пяти минут, пока вы просматриваете выборку из 200 изображений, корректируя настройки в соответствии с вашими вкусами и ожиданиями от результатов работы модели.

В настоящее время MidJourney проводит альфа-тест своей модели, которая управляется сообществом, и планирует добавить больше функций в течение последующих 60 дней. Чтобы воспользоваться этой функцией, просто введите `/settings` в окне чата Discord или на веб-платформе, отправьте сообщение и измените стандартную модель с V7 среди представленных вариантов.

Смотрите также

2025-04-04 10:28