2025年、AI動画は実写と見分けがつかなくなった
――連載第2回、第3回では、御社のマーケティング戦略立案プラットフォーム「CREATIVE BLOOM」を使った、プランニングとクリエイティブの飛躍的な進化を解説していただきました。今回は、特にデジタル広告における動画のクリエイティブについて深掘りしていきます。動画生成技術の発展のスピードも凄まじいものがありますが、社会への浸透も含めて、まず現在の技術レベルをどう捉えておられますか?
柴山:2025年の春ごろから、大きな変化が起きています。生成AIの動画モデルのクオリティが、まさに実写とほとんど見分けがつかなくなった。これが最大の分岐点です。
2023年ごろは、動画といってもパラパラ漫画のようで、イラストやアニメーションに近いものでした。2024年ごろから実写が使われ始めましたが、それでも「AIが作った」とわかる独特の質感や違和感が残っていました。
しかし2025年後半、生成AIの動画モデルは実写とほとんど区別がつかないレベルに達し、広告業界にも強烈なインパクトを与えています。極端に言えば、キャスティング、ロケ、撮影といった従来のプロセス全部を省略してもデジタル広告の動画クリエイティブを作れる状態になりつつある。これがすべて良いこととは一概には言えませんが、テクノロジーとしては間違いなく次のステージに進んだと捉えています。
――広告制作には、量を追うと質を担保できなくなるというトレードオフがあります。たとえばその解消など、デジタル領域の拡張性についてはどのようにお考えでしょうか。
柴山:デジタル広告は、ターゲットに応じて月に何十本も、クリエイティブを制作して精度を高める動きが理想ではあります。ただ、従来はコスト的にも時間的にも限りがありました。ですが、AIによって撮影せずに高品質な素材の生成が可能になって、ご指摘のトレードオフも解消しつつありますし、表現の幅も劇的に広がりました。
また、従来はコンピューターグラフィックスが担っていた領域でも、生成AIで代替することによりコストと時間の圧縮による革命が起きています。今まではマスメディアの予算感でしか叶わなかったようなリッチな表現が、我々がAIを操ることで近いクオリティまで実現できるようになっています。
AIによる民主化と、プロフェッショナルの壁
――表現の幅が広がったというのは、選択肢が増えたということですよね。それが実際に、たとえば新規獲得に寄与したなど、成果につながっているのでしょうか?
柴山:もちろん、弊社の事例ですと数多くの成果向上につながっており、生成AI利用による効果は出てきています。しかしながら、単に表現の幅が広がるだけで新規顧客を開拓できるほど、単純ではないのも現実です。
確かに、生成AIによって絵作りのハードルは下がり、民主化されました。しかし、「誰でも広告が作れる」ことと、「プロとして成果を出す広告を作る」ことの間には、大きな壁があるということは結果として変わりありませんでした。見方を変えると、そこに我々広告会社としての介在価値が、これからも引き続き存在すると考えています。
これまで長く映像表現に向き合ってきたクリエイティブディレクターが生成AIを使いこなすと、出てくるアウトプットの質がまったく違います。私自身、AIモデルの知識やプロンプトの技術に関しては、社内では詳しい方だと自負していますが、その私が作った動画と、AIの知識を持つプロのクリエイターが作った動画には、雲泥の差があります。
AIはあくまで「道具」であり、その道具を使って何を表現し、どう演出するかというクリエイターの脳内にある構想力こそが重要です。
――AIという“翼”を手に入れたとしても、それをどう使って飛ぶかは使い手のスキルに依存する、と。むしろプロの担う役割が変わっていくのかもしれないですね。
柴山:はい。一方で、その「飛び方」の習得も非常に難しいのが現状です。単純に一つの優れたAIモデルを使ってプロンプトを叩けば、思い描いた通りの絵が出るわけではありません。
プロの現場では「この表現を出すにはこのモデルを使い、このパラメーターで調整し、さらに別のモデルで加工する」といった複数の複雑な工程を経て、ひとつのクリエイティブを制作しています。単一のプロンプトで、AIが良い感じにしてくれるのを待つ“ガチャ”を回し続けるだけではなく、狙った演出を実現するために、複数のモデルと手法を組み合わせる。この設計図を描けるかどうかが、AIクリエイティブ制作におけるプロとアマチュアの決定的な差になっています。
「ノード化」がもたらす制作プロセスの革命
――複数のモデルや手法を組み合わせるというお話がありましたが、具体的にはどのようなプロセスで制作されているのでしょうか?
柴山:我々が今、エンタープライズの領域で進めているのが、制作プロセスの「ノード化」です。
一般的に使われるAI生成は、チャット画面に指示を入力する対話型が一般的ですが、広告クリエイティブ動画制作のような複雑な工程だと、それだけでは限界があります。そこで、一つひとつの処理をつなぎ合わせてワークフローを構築する手法をとっています。この処理を「ノード」と言います。
たとえば、「テキストから開始フレームの静止画を作るノード」「終了フレームを作るノード」「その間を動画として補完するノード」「人物の動きを制御するノード」「解像度をアップスケールするノード」といった具合に、処理を部品化し、線でつないでいく。作業手順書をプログラム化したようなイメージですね。
――まるで工場の生産ラインを設計するようですね。なぜ、そのような手法にしたのですか?
柴山:属人性を排除し、品質を高いレベルで標準化するためです。毎週のように新しいAIモデルが登場する現在、個々のクリエイターが全ての最新技術を追いかけ、最適な組み合わせを見つけ出すのは不可能です。組織として100人、200人規模で高品質なクリエイティブを提供し続けるには、プロセスを構造化する必要があります。これは、いずれ多くの広告会社や制作会社が直面する壁だと思います。
我々は、社内のトップクリエイターとエンジニアが共同で開発した「優れた映像表現・演出表現のワークフロー」をテンプレート化しています。これにより、他のクリエイターは複雑な中身をすべて理解していなくても、素材を入れて簡単なチューニングをするだけで、プロが組んだ最高品質のプロセスを再現できるのです。これにより、クリエイターは技術的な試行錯誤に時間を奪われることなく、本来の「表現」や「演出」に集中できるようになります。
動画制作は、やはり静止画より格段に複雑なので、第2回、第3回でお話した「CREATIVE BLOOM」内にはまだ組み込んでいません。ただ、プランニングと配信後の分析、動画のAI効果予測はBLOOM内で行えます。
広告会社が「GPU」に投資する理由
――AI活用というとクラウドサービスを使うイメージがありますが、御社ではローカルモデルやハードウェアへの投資も進めているとお聞きしました。
柴山:はい。GPT ImageやGoogle VeoのようなAPI型のクラウドサービスももちろん利用しますが、それだけではプロの制作現場としては不十分です。
理由の一つは、試行回数の担保です。クラウドのAPIは従量課金制であることが多く、100パターンの検証を何度も繰り返すとコストが膨大になります。並列処理も難しいため、単純に時間もかかってしまいます。これではクリエイターが「もっと試したい」と思ってもブレーキがかかってしまい、精神衛生上も良くありません。
そこで重要になるのが、自社環境(ローカル)で動かすオープンソースモデルの活用です。これならコストを気にせず、納得いくまで何百回でも試行錯誤ができます。また、世の中に数多にある、特定のアニメーションや表現に特化したニッチなモデルを自由に組み込めるのも、ローカル環境の強みです。その環境整備のために、GPUをはじめ多額の投資をしています。
――なるほど。博報堂DYグループの資産であるクリエイティブの力を今後も生かすために、これまでの戦い方をがらっと変えていくわけですね。
柴山:特にデジタル広告クリエイティブの領域において、ゲームが変わっている。だから我々も変わらなければと、高速で準備してきました。その中で、前述の通りクリエイターの能力は意外とAIに奪われなかった、と実感しています。それをつかめたので、クリエイターの知見や暗黙知をこの時代に存分に発揮できるよう、環境を整えたのです。
今、クリエイターの手元にゲーミングPCのような高性能なGPUマシンを配備し、さらに大規模な処理にはオンプレミス(自社保有)のデータセンターにあるGPUサーバーを活用する構成をとっています。クラウド、オンプレミス、そして個人のローカルGPUを組み合わせたハイブリッドな環境です。これにより、一人のクリエイターのデスクが、かつての巨大な撮影スタジオやCGスタジオと同じような「破壊力」を持つようになりつつあります。
GPUと聞くと、AIを作るための学習への投資というイメージが強いですが、強力なオープンモデルも増えた今、我々のような事業会社における推論へのGPU投資も今後重要であると考えています。
未来の制作現場は“カメラのないスタジオ”
――そうした環境整備の先に、どのような制作現場を描いているのでしょうか?
柴山:言うならば、「カメラのないスタジオ」です。従来のスタジオにはカメラがあり、照明があり、セットがありましたが、これからのスタジオには、高性能なGPUマシンとモニターがずらりと並ぶことになります。そこでは、撮影をする代わりに、プロンプトとノードを駆使して映像を生成し、CG編集をする代わりに、AIによる演出処理を行っています。
物理的な撮影は行いませんが、やっていることは撮影と同じです。ライティング、被写体の動き、背景のシズル感といった要素をすべてデスク上の画面の中で完結させる。先行して使いこなしているクリエイターらが、AI専門チームのAIディレクター、そしてエンジニアと組んで、環境のアップデートや調整を重ねています。
――クリエイターにとっては、夢のような環境であり、同時に高いスキルが求められる場所でもありそうですね。
柴山:そうですね。先ほど申し上げた通り、求められるのはAIの操作スキル以上に、本来のクリエイティブの基礎体力です。美しい構図や動きを見極め、人の心を動かすストーリーを描けるか。その本質的な能力さえあれば、AIが可能にする表現や演出で、クリエイティブの可能性を圧倒的に広げられると考えています。
テクノロジーは手段、本質は心を動かすこと
――最後に、こうしたクリエイティブの革新をもって、クライアント企業に新たにどのような価値を提供していくお考えか、お聞かせください。
柴山:究極的には、広告クリエイティブの役割は変わりません。生活者に気づきを与え、心を動かし、行動につなげてもらう。AIはそのための手数を、圧倒的に増やしてくれたに過ぎません。
技術偏重に陥って、AIで大量生産できるから量産しました、では意味がありません。商品やサービスの魅力をどう伝えるかという本質を捉えた上で、コストや時間の制約を超えていく。これがクライアント企業に対する一つの大きなメリットだと考えています。
もう一つは、前述のように表現の幅が広がり、様々なバリエーションの広告を量産できることで、アルゴリズムを介して潜在顧客に出会いやすくなることです。まさに、量と質の担保ですね。
我々の強みは、長く広告に携わって蓄積してきた豊かなクリエイティビティと、それを最大化していくGPUやワークフローという資産の両方を備えていることです。それでいて、技術偏重にならず生成AIのリスクや倫理としっかりと向き合い、この資産を形成していくことも重視しています。今後の人によるクリエイティビティの発揮、ひいては生活者にとってより良い広告体験の創出のために、この環境的な資産が効いてくるので、その強化を今後加速させていきます。
ONE-AIGENTに関するお問い合わせはこちらから
本サービスに関するご不明点やご相談はHakuhodo DY ONEのお問い合わせフォームよりお気軽にご連絡ください。

