Google Veo 3 — новітня відеогенеративна модель на основі штучного інтелекту, розроблена підрозділом DeepMind, яка може стати основою для створення ігрових світових моделей. Її можливості дозволяють не лише формувати реалістичне відео, а й моделювати взаємодію користувачів із віртуальними середовищами.
Про це розповідає News IO
Інноваційні можливості для ігрової індустрії
Генеральний директор DeepMind Деміс Хассабіс не виключає потенціалу використання Veo 3 у відеоіграх. У відповідь на запитання в соціальних мережах щодо можливості дозволити гравцям «грати у відеогру зі своїх відео Veo 3» він відповів:
“now wouldn’t that be something”.
Логан Кілпатрік, керівник продукту Google AI Studio та Gemini API, також прокоментував цю тему, що лише підсилило цікавість спільноти до майбутнього цієї технології.
Від генерації відео до створення інтерактивних світів
На цей час Veo 3 ще не є повноцінною світовою моделлю. Світові моделі імітують складну динаміку реального середовища, даючи можливість агентам прогнозувати результати своїх дій. У той час як Veo 3 створює реалістичні відеопослідовності, їй поки що бракує інтерактивності та активної взаємодії з користувачем.
Google активно розвиває й інші напрями у цій сфері: мультимодальна модель Gemini 2.5 Pro поступово наближається до статусу світової моделі, здатної імітувати функції людського мозку. У грудні DeepMind презентувала модель Genie 2, яка вміє створювати різноманітні ігрові світи. А вже в січні Google оголосила про формування нової команди для розробки AI-моделей, які можуть відтворювати реальність.
Veo 3 зараз перебуває у відкритому тестуванні. Система здатна генерувати не лише відео, а й аудіо — зокрема мовлення та музичні саундтреки. Технологія може моделювати реалістичну фізику руху, однак залишається пасивною генеративною моделлю. Щоб перетворити її на справжній симулятор ігрових світів, потрібно забезпечити інтерактивність, активність і передбачуваність реакцій.
Виклик у створенні відеоігор полягає не лише у досягненні реалістики зображення, а й у можливості керувати подіями в реальному часі. Саме тому перспективним видається гібридний підхід, який би об’єднав переваги Veo та Genie для розробки ігрових чи симульованих світів нового покоління.
У напрямку світових моделей вже працюють й інші компанії. Зокрема, відома дослідниця ШІ Фей-Фей Лі запустила стартап World Labs, який дозволяє створювати тривимірні сцени лише на основі одного зображення. Крім того, Google може зіткнутися з конкуренцією з боку Microsoft, Scenario, Runway, Pika, а також майбутньої відеогенеративної моделі Sora від OpenAI.
Беручи до уваги амбіції Google у сфері світових моделей, а також її значні ресурси та вплив, іншим компаніям важливо уважно стежити за подальшим розвитком цієї технології.