Genie 2 от DeepMind: прорыв в создании динамичных 3D-миров
DeepMind представляет Genie 2, новую модель ИИ, способную создавать сложные 3D-миры в реальном времени. Этот шаг вперед по сравнению с предыдущими 2D-моделями открывает новые горизонты для обучения ИИ и прототипирования.

Новейшая разработка DeepMind, Genie 2, представляет собой значительный скачок в области моделей миров ИИ, способных создавать динамичные 3D-окружения в реальном времени. В отличие от своего предшественника, ограниченного 2D-средами, Genie 2 превосходно справляется с поддержанием сложных 3D-миров и может интерпретировать различные факторы окружающей среды.
Genie 2 работает, генерируя кадры по мере того, как пользователи перемещаются по его симулированным ландшафтам, интерпретируя окружение, чтобы включить эффекты физики. Эта модель поддерживает несколько точек зрения, включая вид от первого лица, от третьего лица и изометрическую перспективу.
Для начала работы требуется всего одно изображение, полученное с помощью модели Imagen 3 от Google или реальных фотографий. Впечатляюще, что Genie 2 запоминает элементы сцены, находящиеся вне поля зрения пользователя, что позволяет точно восстанавливать их при повторном появлении в поле зрения. Однако DeepMind признает, что согласованность мира ограничена примерно 60 секундами.
В настоящее время Genie 2 используется в основном как инструмент для создания сред обучения ИИ и помощи художникам в быстром прототипировании. Ожидается, что это нововведение внесет значительный вклад в эволюцию искусственного общего интеллекта, предлагая богатые и разнообразные тренировочные площадки.