Я попробовал новый видеогенератор от Gemini на базе ИИ и поражён тем, как далеко шагнул искусственный интеллект.


🚀 Хочешь улететь на Луну вместе с нами? Подписывайся на CryptoMoon! 💸 Новости крипты, аналитика и прогнозы, которые дадут твоему кошельку ракетный ускоритель! 📈 Нажмите здесь: 👇

CryptoMoon Telegram


TL;DR

  • Google выпускает обновление своего чатбота Gemini с поддержкой модели Veo 2, которая преобразует текст в видео.
  • Подписчикам Gemini Premium доступна функция использования Veo 2 для создания коротких видео-клипов длительностью до 8 секунд в разрешении 720p.
  • Мы были впечатлены тем, как работал Veo 2, хотя ясно, что еще нужно проделать значительную работу.

Темп развития технологий искусственного интеллекта (ИИ) действительно поразительный. Современные генераторы изображений ИИ теперь способны создавать изображения настолько живые и реалистичные, что их легко спутать с настоящими фотографиями — это значительный скачок по сравнению с пикселизованными, низкокачественными изображениями, создаваемыми ранними моделями. Несмотря на прогнозы о том, что потребуется несколько лет для достижения аналогичных результатов в области генерации видео из текста, успехи вроде Google’s Veo 2 демонстрируют невероятные шаги вперед в этой сфере. Изначально ограниченные доступом, сейчас Google делает Veo 2 доступным для публики, позволяя пользователям с доступом к чату Gemini создавать короткие видеоролики.

Что такое Veo 2?

Как исследователь, я в настоящее время работаю с последней моделью видеогенерации от Google, Veo 2. Эта передовая технология предназначена для создания высококачественных видеороликов на различные темы и стили. Что отличает Veo 2 от других моделей, так это её улучшенная способность понимать физику реального мира и тонкости человеческого движения и выражения лица, что приводит к меньшим неточностям. Google утверждает, что такое улучшение делает Veo 2 одной из самых передовых доступных сегодня моделей видеогенерации. Для предотвращения потенциального злоупотребления все видеоролики, созданные с помощью Veo 2, имеют невидимую метку SynthID, уникальный идентификатор, свидетельствующий о том, что они были созданы искусственным интеллектом.

Несмотря на то что Google представила Veo 2 год назад, она стала более доступной только недавно. Вначале Veo 2 была доступна исключительно через программу раннего доступа VideoFX, для чего нужно было подписаться на лист ожидания. Хотя функция Dream Screen на YouTube включает использование Veo 2 для создания видеофрагментов, эти клипы нельзя использовать вне платформы.

С этим обновлением большее количество пользователей теперь может использовать Veo 2 для создания коротких видеообзоров. Google объявил, что инструмент для создания видео внутри Gemini доступен продвинутым подписчикам как на веб-платформах, так и на мобильных устройствах. Эта функция поддерживает все языки, которые предлагает Gemini, и не требует дополнительной установки программного обеспечения или специальных знаний.

Как использовать Veo 2 для создания видео?

Чтобы использовать модель Veo 2 в Google Gemini, сначала необходимо подписаться на план Google One AI Premium, который включает доступ к Gemini Advanced. После этого можно открыть либо приложение, либо веб-сайт Google Gemini и найти ниспадающее меню выбора модели. Затем выберите опцию Veo 2 для доступа к ней.

После того, как вы сделаете свой выбор, текст «Сгенерируйте видео продолжительностью 8 секунд из текста» появится над полем ввода текста. Для создания видео просто введите или произнесите ваш запрос в этом поле, затем нажмите кнопку отправки. Подождите, пока Gemini обработает ваш запрос и создаст 8-секундное видео в ландшафтном формате с разрешением 720p. Имейте в виду, что во время этого процесса другие функции чата Gemini могут быть недоступны.

Gemini может потребоваться немного времени для создания вашего видео по запросу, поэтому вернитесь позже. К сожалению, нет уведомлений о готовности, так что не забудьте оставить страницу открытой или проверьте её снова. Если ваш запрос противоречит политике контента Gemini, он может быть отклонён. В этом случае вам потребуется внести изменения и повторно отправить.

После создания видео вы можете скачать его нажав кнопку «Скачать», которая находится в правом верхнем углу видео. На мобильных устройствах также можно поделиться видео с контактом или на социальных сетях, используя кнопку «Поделиться». Поскольку Gemini часто дает краткие и иногда малоинформативные названия для своих роликов, рекомендуется изменить заголовок, если хотите сохранить загруженное видео.

По данным Google, существует ограничение на количество видеороликов, которое можно создать за месяц, хотя точное число не уточняется. Тем не менее, Google уверяет, что будет предупреждать пользователей о приближении к этому лимиту.

Другим способом достичь уровня Вео 2 является использование инструмента Whiskey Animator, который позволяет превращать картинки в краткие восьмисекундные анимации. Whiskey Animator развивает возможности модели Whiskey, предназначенной для генерации изображений на основе текстовых и графических подсказок.

За последние пару недель я использовал Veo 2 через Gemini и за этот период создал множество видеороликов с различными стилями в качестве результата. Ниже вы найдете мои первоначальные впечатления о системе создания видео от Google.

Видео, сделанные с помощью Veo 2, выглядят отлично, но иногда не имеют смысла.

Я весьма удивлен высоким качеством видео, произведенных VEO 2; они заметно лучше тех, что создавали предыдущие модели. Особенно заметен скачок в качестве при съемке сцен с участием людей и животных.

В попытке имитировать вирусный ролик ‘Will Smith ест спагетти’, часто используемый как неофициальное требование для возможностей искусственного интеллекта, я использовал Veo 2. Однако Gemini отказался от создания видео с участием Will Smith и попросил создать видео о том, как ‘мужчина наслаждается спагетти’. Вот результат:’

Обратил внимание на одну заметную деталь: когда я попросил создать промо-видео, напоминающее автомобильную рекламу, с элегантным красным внедорожником, скользящим по живописному шоссе Тихоокеанского побережья в дневное время. Видео успешно передало задуманный образ, и машина выглядела очень стильно.

На видео не видно водителя, но так как я велел создать рекламу автомобиля, решил проигнорировать эту деталь.

Недавно я создал впечатляющее видео по запросу изобразить прусского солдата, созданного с помощью искусственного интеллекта, вооруженного и движущегося в стиле черно-белого документального фильма времен Первой мировой войны при выходе из траншеи. Хотя Veo 2 не показал визуально, как солдат действительно вылезал из траншеи, меня поразило, насколько реалистичными выглядели движения, созданные искусственным интеллектом.

Чтобы оценить способности Veo 2 в работе с животными, я попросил его создать видео, на котором утка пьет воду из маленького синего стакана. Поскольку мне нравится наблюдать за утками, меня поразило, насколько точно ИИ имитировал движения хвоста и клюва утки во время питья.

Видео, созданные с помощью Veo 2, обычно впечатляют своим качеством, но иногда не имеют логического смысла. Например, когда я запросил видео о человеке, который ест картофельные чипсы на диване, персонаж и обстановка выглядели реалистично, однако действие поедания чипсов было странным: вместо того чтобы взять несколько штук из верхней части пакета, казалось, что они волшебным образом появились в его руке сбоку.

Одной из проблем, с которой я столкнулся при использовании Veo 2, является его склонность не полностью следовать моим конкретным указаниям. Например, когда я попросил создать видео о солдатах, выгружающихся из лодок и штурмующих берег Нормандии во время Второй мировой войны, в ролике отсутствовали солдаты, покидающие лодки. Аналогично, запрос на создание замедленного видео трансформации Оптимуса Прайма также не был выполнен должным образом: процесс трансформации показан не был. Было удивительно, что последний запрос был принят, учитывая защищенный авторским правом статус франшизы «Трансформеры».

Вот все подсказки, которые я использовал для создания этих 20 видео:

  1. Анимированное видео зеленого бота (талисмана операционной системы Android), резвящегося на поле цветов и поедающего яблоко.
  2. Сфотографируйте дроном вид на Саграда Фамилия в Барселоне (Испания) во время золотого часа.
  3. Замедленная видеозапись человека, открывающего бутылку шампанского в честь получения повышения на работе.
  4. Турист записывает видео жирафа в зоопарке, используя свой смартфон Google Pixel. Видение снаружи позволяет наблюдать как за туристом, так и за жирафом.
  5. Создайте видео в стиле японской анимации о ниндзя, который ночью прыгает через приближающуюся полицейскую машину.
  6. Создайте кадр, напоминающий дрон, где красная спортивная машина едет вдоль живописной трассы Тихоокеанского побережья днем.
  7. Создайте видео в виде автомобильного рекламного ролика, показывающего новейший красный внедорожник на фоне живописной дороги Тихоокеанского побережья днем.
  8. Создайте видео, на котором группа топ-менеджеров смеется в зале заседаний во время презентации, демонстрирующей рост акций компании.
  9. Создай видео в стиле документальной хроники черно-белое, показывающее прусского солдата, который вылезает из окопа с винтовкой во время Первой мировой войны.
  10. Создайте видео, показывающее солдат, которые выходят из лодок и штурмуют пляж Нормандии во время Второй мировой войны. Сделайте изображение немного размытым и добавьте сильную тряску камеры для имитации динамичного кадра.
  11. Мужчина ест спагетти.
  12. Вид сверху на ракету, покидающую атмосферу и входящую в космос над континентальной частью США.
  13. Крупный план на милого оранжевого хомяка, которому ветеринар закапывает капли в глаза с помощью пипетки. Раствор капель падает в глаза хомяку сверху, пока его держит за руку ветеринар.
  14. Цельно нарисованная анимация бездомного кота, преследующего мышь по аллее шумного города днем.
  15. Отец показывает своему сыну анимацию перелистывания книги, изображающей идущего кота.
  16. Видео женщины, прыгающей с парашютом в специальном снаряжении.
  17. Видео самурая вставляющего свой меч обратно в ножны на фоне падающих листьев вишневых деревьев (в стиле японской анимации).
  18. Видео, где утка пьет воду из маленького синего ведра.
  19. Сделайте видео, на котором Оптимус Прайм из Трансформеров трансформируется в замедленном темпе.
  20. Видеозапись молодого человека, сидящего на диване и поедающего пакетик чипсов.

Как поклонник, я обнаружил, что короткие беззвучные клипы, созданные Veo 2 в Gemini, великолепны, но для преобразования их в форматы, совместимые с YouTube, требуется ручная обработка. Если ваша цель — оптимизировать весь процесс видеопроизводства, Google Vertex AI Media Studio может стать настоящим прорывом! Эта замечательная платформа объединяет различные модели создания искусственного интеллекта: Veo 2 для видео, ImageN 3 для изображений, Chirp для озвучивания и Lyria для фоновой музыки. С помощью всего лишь текстового запроса можно легко генерировать высококачественные видео, делая процесс создания контента более гладким.

Как член сообщества Gemini Advance, почему бы вам не попробовать Veo 2 и поделиться с нами своими шедеврами? Мне было бы очень интересно увидеть ваши работы!

Смотрите также

2025-04-15 20:19