「見る動画」から「入る世界」へ:Project Genieが作った奇妙でリアルな実例たち

最近、動画生成AIの進化が止まりません。SoraやVeoといった名前を聞かない日はないくらいですが、どうやら私たちは大きな勘違いをしていたような気がしてきました。これまでのAIは、私たちがポップコーンを食べながら眺めるための「映画」を作ってくれていただけでした。
ところが、Google DeepMindが発表したProject Genieは、どうも様子が違います。

これは単に映像を作るのではなく、私たちがコントローラーを握って入り込める「世界」そのものを生み出しているようなのです。
ルンバに乗った猫が見る景色
正直なところ、最初にこのニュースを見たときは「また新しい動画生成AIか」と思いました。でも、公開されたデモ映像を見て、その認識はすぐに覆されました。
例えば、あるデモではルンバ(ロボット掃除機)に乗った猫の視点でリビングルームを探索しています。これだけなら普通の動画かもしれませんが、驚くべきは、この映像が事前にレンダリングされたものではないという点です。ユーザーが操作(例えばキーボードのWキーを押して前進)すると、その瞬間にAIが「猫が前に進んだら、次にどんな景色が見えるか」を予測して、リアルタイムで映像を描画しているのです。
もっと奇妙で面白い例もあります。あるユーザーは、タバコの箱になって地下鉄の駅を探索する世界を作り出しました。
想像してみてください。あなたはタバコの箱です。薄暗い地下鉄のホームを、箱の視点でカサカサと移動するのです。こんな体験、現実では絶対にできませんし、わざわざCGで作ろうとも思わないでしょう。でもProject Genieなら、プロンプトひとつでそんな「ありえない世界」に入り込めてしまうのです。
他にも、月面の岩だらけの表面を走る車や、ウイングスーツを着て山肌を滑空する人物など、多様な世界が生成されています。スキーヤーを操作して雪山を滑り降りる例では、ジャンプやターンといったアクションに合わせて、雪景色が滑らかに流れていきます。これらはもはや「動画」というより、作りかけの「ビデオゲーム」に近い感覚ではないでしょうか。
「再生」ではなく「反応」を作っている
なぜこんなことができるのでしょうか? 少し技術的な話をすると、Project Genieの裏側には「ワールドモデル」と呼ばれる技術があるようです。
従来の動画生成AIは、映画監督のように「最初から最後までのシーン」を一気に作り上げます。一方で、Project Genie(およびその基盤モデルであるGenie 3)は、「次に何が起こるか」をひたすら予測し続ける予言者のような働きをします。
- 現在のフレーム(画面)を見る
- ユーザーの操作(「右へ移動」など)を受け取る
- 「この状況で右に行ったら、景色はどう変わるか?」を予測して次のフレームを描く
これを毎秒数十回のスピードで繰り返すことで、あたかも自由に動き回れる世界が存在するかのように錯覚させているわけです。だからこそ、物理法則が少し怪しかったり、看板の文字が歪んだりすることもありますが、自分の意志に対して世界が「反応」してくれる没入感は、これまでのAI動画とは決定的に違います。
受動的な観客から、能動的な冒険者へ
こうして事例を見ていくと、私たちがコンテンツとどう関わるかが根本から変わりそうな予感がしてきます。これまでは「AIが作った動画を見る」という受動的な体験でした。「すごい映像だね」と感心して終わりです。
しかしProject Genieが提示しているのは、「AIが作った世界に入る」という能動的な体験です。タバコの箱になって地下鉄の隅々まで探索してもいいし、見たこともない惑星で車を走らせて、崖の向こうに何があるのかを確かめに行ってもいい。そこには、予定調和ではない自分だけの物語が生まれる余地があります。
もちろん、現時点では完璧とは言えません。生成された世界に長居しようとすると、破綻が見えたりもします。でも、一枚の画像や短いテキストから、これほどインタラクティブな「遊び場」が一瞬で立ち上がる未来には、ワクワクせざるを得ません。
さて、ここで一つ気になることがあります。「そんなにすごいなら、いつまでも遊んでいたい」と思うのが人情ですが、実はProject Genieには「60秒」という不思議な制限があるようなのです。たったの1分です。カップラーメンも作れません。
なぜGoogleは、せっかくの無限の世界にそんな短い制限を設けたのでしょうか? 実はここ深掘りしてみると、このツールの本当の使い道が見えてくる気がします。単なる技術的な限界なのか、それとも別の意図があるのか。次はこの「60秒」の意味について、少し視点を変えて考えてみましょう。
60秒しか遊べない?いや、それが「試作の高速化」という本質なのです

前のセクションで少し触れましたが、Project Genieで生成された世界には、60秒という厳しい時間制限があります。カップラーメンが出来上がるよりも早く、魔法は解けてしまうわけです。「たったそれだけ?」と肩を落とす気持ち、よく分かります。せっかく面白い世界に入り込めたのに、すぐに追い出されてしまうなんて、ゲームとしては欠陥品のように思えるかもしれません。
しかし、どうやらこの「短さ」と「不完全さ」こそが、Project Genieの実用性を支える重要な鍵のような気がしてきました。ここでは視点をガラリと変えて、このツールを「遊ぶためのゲーム機」ではなく、「捨てるための試作機」として捉え直してみましょう。
1分で検証して、惜しみなく捨てる
私たちが普段遊んでいるゲーム、例えば『ゼルダの伝説』や『マリオ』のような作品を作るには、膨大な時間と労力がかかります。キャラクターがジャンプして着地する挙動ひとつとっても、プログラマーやデザイナーが何日もかけて調整しているはずです。
ところが、Project Genieはプロンプト(指示文)を入力するだけで、物理法則もどきが働いた「動ける世界」を即座に出してくれます。もちろん、挙動は少し変かもしれませんし、看板の文字が読めないこともあります。でも、「このアイデアは面白いか?」を確かめるためだけなら、完璧である必要はないのではないでしょうか。
例えば、ゲーム開発の現場を想像してみてください。
「月面でレースゲームをしたら面白いんじゃないか?」というアイデアが出たとします。これまでなら、それを検証するために、まずプログラマーが車の挙動を書き、デザイナーが月の地形を作り、何週間もかけて「試作品」を作っていました。そして遊んでみて初めて「あ、意外とつまらないね」と気づくのです。これは痛い損失ですよね。
でも、Project Genieがあればどうでしょう。「月面を走る車」と入力して、生成された世界を1分間走り回ってみる。その60秒で「浮遊感が足りないな」とか「視界が悪すぎるな」といった感触がつかめます。もしつまらなければ、その世界を捨てて、また新しいアイデアを試せばいいだけです。
つまり、60秒しか遊べないというのは、「60秒で結論を出して、次に行け」というメッセージなのかもしれません。完成品を作るのではなく、無数のボツ案を高速で処理するための「意思決定装置」として使う。これが、今のところ最も理にかなった使い道ではないかと思います。
教育や訓練での「もしも」を量産する
この「高速な使い捨て」という特性は、エンターテインメント以外の分野でも役に立ちそうです。
高価なVRシミュレーターを用意しなくても、「もしも」の状況を無限に作り出し、体験しては捨てる。これにより、マニュアルを読むだけでは得られない「現場の直感」を養うことができるはずです。ここでも、完璧な物理シミュレーションであることより、多様な状況を数多く体験できることの方が重要になります。
実はAI自身のための「ジム」かもしれない
そしてもう一つ、少し未来の話をさせてください。実はこのProject Genie、人間が遊ぶためだけでなく、AI(人工知能)自身を鍛えるための「ジム」としても使われているようなのです。
Google DeepMindの研究チームは、SIMA 2というAIエージェント(ゲームをプレイできるAI)を、Project Genie(Genie 3)が作った世界の中で遊ばせる実験を行っています。
AIエージェントを賢くするには、たくさんの「初めて見る環境」で経験を積ませる必要があります。でも、現実世界や既存のゲームだけで学習させるには限界があります。そこで、Project Genieに「未知の世界」を無限に生成させ、そこでAIエージェントに特訓をさせているわけです。
こう考えると、60秒という制限も、人間にとっては短すぎますが、AIの学習サイクルにとっては「1エピソード」としてちょうど良い長さなのかもしれません。私たちがこのツールで遊んでいるとき、実は裏側で「未来のAI」のためのトレーニング環境作りを手伝っている……なんて想像すると、なんだかSFチックでワクワクしませんか?
完璧さよりもスピードを選ぶ勇気
結局のところ、Project Genieの本質は「完成された世界への没入」ではなく、「未完成なアイデアの高速検証」にあるのだと思います。
60秒しか持たない世界。それは儚いですが、だからこそ私たちは執着せずに次々と新しい可能性を試すことができます。じっくり作り込む職人的な作業から離れて、「とりあえず形にしてみる」というスピード感を手に入れること。それが、このツールが私たちにくれる最大の能力なのかもしれません。
さて、そんな「高速な試作」を実際に自分の手でやってみたくなりませんか? 「でも、どうやって指示を出せばいいの?」と不安に思う方もいるでしょう。実は、Project Genieには特有の「プロンプトのコツ」があるようなのです。次は、もし明日このツールが手元に来たときに困らないよう、具体的な操作フローと命令の出し方を予習しておきましょう。
もし手元にあったらどう使う?操作フローと「効く」プロンプトの書き方

もし今、あなたの手元にProject Genieがあったとしたら、どうやってその魔法を使うのでしょうか。
多くの人は「テキストボックスに呪文を打ち込んで、動画が出てくるのを待つ」という、これまでの生成AIと同じ作法をイメージするかもしれません。
しかし、調べていくうちに、どうやらProject Genieの操作は、絵を描くというよりは、ラジコンやゲームのセットアップに近いような気がしてきました。

日本で使えるようになったその日に、迷わず「世界」を立ち上げるために。米国ですでに始まっている実際の操作と、AIに意図を伝えるためのちょっとしたコツを予習しておきましょう。
ラジコンをセットするような3ステップ
Project Genieを使う流れは、大きく分けて3つのステップで構成されています。Googleの公式情報を見ると、「描いて、入って、作り変える」というサイクルを回す設計になっているようです。
- ワールドスケッチ(World Sketching)
まずは世界の「下地」を作ります。テキストでどんな場所かを入力するか、手持ちの画像をアップロードします。面白いのは、ここでいきなり世界に入るのではなく、Nano Banana Proなどの画像生成AIが作った「プレビュー画像」を確認できる点です。ここでイメージと違えば修正し、納得がいったら生成ボタンを押します。
- ワールドエクスプロレーション(World Exploration)
ここがハイライトです。生成された世界に飛び込みます。操作はPCゲーマーにはお馴染みのWASDキー(移動)やスペースバー(ジャンプ)を使います。ただ動画を眺めるのではなく、自分の手でカメラやキャラクターを動かし、その入力に合わせて世界が描画されていくのです。
- ワールドリミックス(World Remixing)
探索してみて「ここはもっと暗い方がいいな」とか「雪景色にしたいな」と思ったら、既存の世界をベースにプロンプトを追加して改変できます。ゼロから作り直すのではなく、気に入った世界を少しずつ理想に近づけていくわけです。
「風景」だけでなく「演技」を指示する
ここで重要なことに気づきました。美しい絵を作らせるための呪文と、動ける世界を作るための命令は、どうやら勘所が違うようなのです。
チュートリアル動画などを見ると、効果的なプロンプトには「環境(Environment)」だけでなく「キャラクター(Character)」の定義が不可欠だと分かります。
「環境」は分かりますよね。「土の道」とか「サイバーパンクな都市」といった舞台設定です。
しかしProject Genieにおいて重要なのは、その世界を「誰が」「どう動くか」を指定することなのです。これは単に「赤いロボット」といった外見だけでなく、アクションや物理的な干渉まで書くのがコツのようなのです。
例えば、単に「森」と書くだけでは、AIはどう描画していいか迷ってしまうかもしれません。そこで、演出家になったつもりでこう付け加えてみるのはどうでしょうか。
- 悪い例:「美しい森、木漏れ日」
- 良い例:「苔むした森。キャラクターはドローンで、低空を滑らかに飛行する」
- 良い例:「荒れた砂漠。重厚なオフロード車で、地面に土煙と轍(わだち)を残しながら進む」
こうすることで、AIは「どんな視点で」「どんなスピード感で」「地面とどう作用しながら」その世界を描画し続ければいいかを理解できるわけです。静止画の美しさよりも、動きの質を指定する。これがワールドモデルを使いこなすための新しいリテラシーになりそうな気がします。
「一枚の絵」が入り口になる
言葉で説明するのが難しければ、画像を見せるのが手っ取り早いかもしれません。
Project Genieは画像をアップロードして、そこから世界を広げることができます。例えば、自分の部屋の写真をアップロードして、「ペットの視点で探検する」といった指定もできるようです。
これはクリエイターにとって強力な武器になるのではないでしょうか。イラストレーターが自分の描いた一枚絵の中を歩き回ってみたり、建築家がパース図の中に入って空間の広がりを確認したりする。「もしこの絵の中に入れたら?」という想像を、たった数秒でシミュレーションできるわけです。
残念ながら、今はまだ日本からこのツールに触れることはできません。しかし、操作のイメージと「演出家としての視点」を持っておくことは、無駄にはならないはずです。
さて、使い方が分かったところで、「じゃあ日本に来るまで指をくわえて待っていればいいの?」と思うかもしれません。それはあまりに退屈ですよね。
実は、Project Genieそのものは使えなくても、今すぐ「ワールドモデル」の本質に触れる方法ならあるんです。次は、私たちが今すぐ取れる具体的なアクションと、未来への準備について考えてみましょう。
日本から指をくわえて待つのはやめよう。今すぐ試せる「代替案」と準備

ここまでProject Genieの魅力をお話ししてきましたが、ここで一つ、残念な事実をお伝えしなければなりません。
これまでの調査によると、現時点ではProject Genieは米国在住者限定の提供となっており、日本からは直接利用することができないようです。
「なんだ、結局使えないのか」とガッカリされたかもしれません。ネット上を探せば、VPNを使って位置情報を偽装するような「裏技」も噂されているかもしれませんが、規約違反のリスクを冒してまで試すのは得策ではありません。
でも、指をくわえて待っているだけというのは、あまりに退屈ではないでしょうか。
どうやら、Project Genieそのものは使えなくても、「世界を生成して動かす」という体験を先取りする方法ならありそうです。怪しい裏技ではなく、堂々と試せる「代替案」について考えてみましょう。
実はすごい「代替ツール」たち
Project Genieが注目されていますが、実は世界中で似たような技術(ワールドモデル)の研究が進んでいます。その中には、設計図が公開(オープンソース化)されていて、誰でも試せるものがあるのです。
私が調べた限り、特に面白いと感じた2つのツールを紹介します。これらを使えば、Project Genieが日本に来る前に「未来の予習」ができる気がします。
1. 長く遊びたいなら「LingBot-World」
Project Genieには「60秒しか生成できない」という制限がありましたね。しかし、Robbyant社が公開しているLingBot-WorldというAIモデルは、なんと最大約10分間も安定して世界を生成し続けられるそうです。
これなら、「ちょっとしたシーン」だけでなく、「長い探索」のテストができそうです。しかも、キーボード操作に対する反応速度(遅延)も1秒未満と非常に高速です。「AIが作った世界を、自分の手でスムーズに動かす感覚」を掴むには、むしろこちらの方が適しているかもしれません。
2. データとして持ち出したいなら「HunyuanWorld-1.0」
もう一つは、Tencent社が公開しているHunyuanWorld-1.0です。
このツールの面白いところは、生成した世界をただの映像として終わらせるのではなく、3Dデータ(メッシュ)として書き出せる点です。
これはクリエイターにとって大きな意味があります。つまり、AIで作った世界を、UnityやUnreal Engineといった既存のゲーム制作ツールに持ち込んで、実際にゲームの一部として使える可能性があるのです。Project Genieが「アイデア出し」に特化しているとしたら、こちらはより「実制作」に近い検証ができるのではないでしょうか。
これらはオープンソースなので、技術に詳しい方なら自分のPCや会社のサーバーで動かすことができます。これこそ、最も合法的で実践的な「裏技」と言えるんじゃないでしょうか。
あなたの仕事を「1分」に切り刻んでみる
ツールを導入するのはハードルが高い、という方でも、今すぐできる「準備」があります。
それは、「自分の仕事を60秒単位に分解してみる」という思考実験です。
Project Genieの本質は「1分間の試作」にあるとお話ししました。だとしたら、ツールが手元になくても、「もし1分でシミュレーションできるなら、業務のどこを切り出すか?」を考えておくことはできます。
例えば、こんな風に分解できるかもしれません。
- 防災の担当者なら:「避難訓練のすべて」ではなく、「火災発生から非常口を選ぶまでの最初の1分」の視界をシミュレーションしてみる。
- ゲームプランナーなら:「全ステージ」ではなく、「新しい操作キャラがジャンプした時の浮遊感」だけを確かめる。
- 建築家なら:「建物全体」ではなく、「エントランスを抜けた瞬間の広がり」だけを動画にする。
日本には、富士通が空間ワールドモデルを発表するなど、派手なデモよりも実務への応用を着実に進める土壌があります。
「なんでもできる魔法」を待つのではなく、「ここだけはAIで高速化できる」というピンポイントな使い道を見つけておく。そうすれば、Project Genieが日本で解禁されたその日に、誰よりも早く価値を引き出せるはずです。
さて、私たちはこれから「動画を見る」時代から、「世界に入る」時代へと足を踏み入れます。
その世界は、完璧ではないかもしれません。60秒しか続かないかもしれません。でも、そこには私たちがまだ見たことのない「自分の想像力の内側」が広がっているはずです。
準備はいいでしょうか? 次の世界でお会いしましょう。
調査手法について
こちらの記事はデスクリサーチAIツール/エージェントのDeskrex.AIを使って作られています。DeskRexは市場調査のテーマに応じた幅広い項目のオートリサーチや、レポート生成ができるAIデスクリサーチツールです。
調査したいテーマの入力に応じて、AIが深堀りすべきキーワードや、広げるべき調査項目をレコメンドしながら、自動でリサーチを進めることができます。
また、ワンボタンで最新の100個以上のソースと20個以上の詳細な情報を調べもらい、レポートを生成してEmailに通知してくれる機能もあります。
ご利用をされたい方はこちらからお問い合わせください。
また、生成AI活用におけるLLMアプリ開発や新規事業のリサーチとコンサルティングも受け付けていますので、お困りの方はぜひお気軽にご相談ください。
市場調査やデスクリサーチの生成AIエージェントを作っています 仲間探し中 / Founder of AI Desk Research Agent @deskrex , https://deskrex.ai





コメント