Nano BananaやNotebookLMの体験をどう企業に活用するのか
──Gemini 3の進化でNano BananaやNotebookLMなどに関心が向けられています。こうした個人向けツールと、企業向けAI活用の関係をどう捉えればいいのでしょうか。
下田:Nano Bananaのようなツールは、もともと個人が手軽に試せるものとして広がりました。ただ、そこでインスパイアされた方が「業務でも使いたい」と思った時に、いざ企業内で導入しようとするとセキュリティやガバナンスなどさまざまな課題に直面します。
エンタープライズ向けのVertex AIでは各種機能をAPIとして提供していますし、Gemini Enterpriseでも利用できるようになってきました。もうひとつ押さえておきたいのは、個人向けと企業向けは全く別物ではないということです。テクノロジーの根幹は同じで、「Googleを支えるテクノロジーを法人向けに提供する」というのがGoogle Cloudの基本思想です。たとえばNotebookLMも、Gemini Enterprise上で「NotebookLM Enterprise」として提供されています。
──Nano Banana Proでは、それまでのAIグラフィックスに比べ、きちんとした日本語が表記されることが画期的でした。技術的にはどういう背景があるのでしょうか。
下田:テキストのマルチリンガル対応はLLMの学習プロセスからある意味当然でしたが、画像や動画、音声となると、さらに一段上の技術的努力が必要になります。Google DeepMindは東京にオフィスを構えており、日本にベースを持つ研究者が日本語を理解しながら研究活動をしています。しかもDeepMindは単なる研究組織ではなく、プロダクトチームと密接に連携する体制をとっているため、研究成果がスピード感をもって製品に反映されるサイクルができています。
──企業が使う場合、個人向けのGeminiアプリで出てくる「AIで作成」というウォーターマーク表示はどうなるのでしょうか。
下田:Gemini for EnterpriseやVertex AI経由のアウトプットには、ウォーターマーク表示は入りません。AI Studioで作る場合も同様です。ただし、サービスによって扱いは異なります。
北瀬:一方で、SynthIDと呼ばれる電子透かしはすべてのアウトプットに埋め込まれています。表面的なウォーターマークがなくても、AIで作られたかどうかを判定できるツールが存在するので、目に見える表示の有無と技術的な追跡可能性は別のレイヤーで担保されている形です。
なお、Gemini Enterpriseは誤解されがちですが、Geminiの「最上位バージョン」という意味ではありません。通常のGeminiの基盤モデルを使いつつ、企業で安全にAIを使うためのプラットフォームであり、企業向けのブランドだと理解してください。
──Vertex AIはGeminiのためのAI開発プラットフォームですか。
下田:いいえ、Geminiに限定されているわけではありません。Vertex AIには複数のAIモデルを一覧から選んで利用できる「Vertex AI Model Garden」という仕組みがあり、AnthropicのClaudeやDeepSeekなども選択・デプロイできます。ユースケースに応じて最適なモデルを柔軟に選べるのがVertex AIの特徴です。
「モデルアーマー」と著作権保証──企業が踏み出すためのガードレール
──個人が使って「いいな」と思ったものを業務に持ち込む時、セキュリティや著作権のリスクが壁になります。Google Cloudではどう対応しているのでしょうか。
下田:まず外側の層として、LLMに対する攻撃を専門に防ぐセキュリティサービス「モデルアーマー(Model Armor)」があります。APIでモデルを提供する場合、プロンプトインジェクション──悪意のある入力でAIの挙動を操ろうとする攻撃──が仕掛けられることがあります。Webサービスへのリクエスト量攻撃やセキュリティ攻撃は以前からありましたが、LLMにはLLM固有の攻撃パターンがあり、モデルアーマーはそこに特化して防御するサービスです。
──その内側にはどういった仕組みがありますか。
北瀬:中間の層はガバナンスとアクセス制御です。データを日本国内から出さないリージョン制御に加え、OAuth 2.0などの標準的な認証認可をベースに、外部サービス連携時もアクセス権を引き継ぎます。
たとえば「この従業員はサーバーのドキュメントのここは見られるが、職位の異なる人はそこにはアクセスできない」という権限制御が、AIを介してもきちんと維持される仕組みです。AIを通じてデータが無秩序に見えてしまうと、企業のガバナンス上問題になりますが、手組みのRAG(検索拡張生成)で権限継承を作り込むのは非常に大変です。Google Cloudのプラットフォームでは各サービスの既存権限を引き継ぎながら動作するため、「自分の権限の範囲でエージェントを動かせる」という体験が実現できます。非エンジニアもエージェントを作れる時代に入る中で、このガバナンス層の重要性は一層増しています。
──著作権の問題についてはいかがですか。企業が最も気にするリスクのひとつだと思いますが。
下田:最も内側の層が「インデムニフィケーション(知的財産に関する補償)」です。お客様から大変多くお問い合わせいただくのが「画像やテキストを生成して著作権侵害になっていないか」「訴えられたらどうなるのか」という懸念です。
これに対してGoogle Cloudでは、規約のレベルで「著作権侵害で訴えられた場合にGoogleがサポートを行う」と明記しています。しかも、画像・動画・テキストのそれぞれにこの補償を適用しており、対象となるプロダクトも明確に定義しています。テキストのみ、あるいは画像のみという対応にとどまるベンダーもある中で、幅広いモダリティをカバーしている点が特徴です。
この対応は2023年1月のサービス開始初期から行っています。画像・動画生成ブームの到来以前から必要性を認識し、先行して整備してきた経緯があります。最近は社内利用だけでなく、外部向けサービスにAI生成コンテンツを使うケースが増えたことで、問い合わせも急増しているといいます。
北瀬:最終成果物ではなく、たとえば絵コンテ作成やアイディエーション、チェックなど中間工程でのAI利用であれば、著作権リスクは低いと考えられます。ゼロイチのアイディエーションに使う分にはほとんど問題ないといえます。実際、動画制作で危険なシーンだけをAIで生成し、CG制作コストを大幅に抑えるといった部分的な活用も広がっています。
