theNet by CLOUDFLARE

AIの力は、その「基盤」の良し悪しで決まります

AIを活用したパーソナライズ体験を実現するための条件

多くの企業が、業務効率の向上と競争優位性の獲得を目指し、AIの導入を加速させています。実際、最近の調査では、回答者の71%が「すでに生成AI(GenAI)を日常的に使用している」と回答しています。

既存のGenAIサービスを活用するだけでなく、多くの企業が、高度にパーソナライズされた顧客体験を提供するために、独自のAI搭載アプリやAIエージェントを構築しています。こうした取り組みは、高度にカスタマイズされた購入提案、製品情報の提示、グローバルな顧客に対するサポート機能を提供するアプリやエージェントを作成する大きなチャンスでもあります。

このハイパーパーソナライゼーションへの流れとともに、アプリケーション開発のモデルも変化しています。開発者はアプリケーションをAIエージェントとして機能する、より小さな単一機能のコンポーネントに分解する新しい手法を取り入れ始めています。この新しいモデルにより、開発者は新しいエージェントを迅速に作成しながら、同時にパフォーマンス、耐障害性、セキュリティを強化することができます。

しかし、ここに1つ大きな課題があります。多くの開発者がアプリの構築にハイパースケーラーを使用していますが、これらのハイパースケーラーはこの新しいアプリケーションモデルを適切にサポートできていません。そもそもの基盤が数百万人規模のユーザーに向けて個別に最適化されたアプリやエージェントを配信するようには設計されていません。

今求められているのは、このAI時代にふさわしい新しい「基盤」です。次世代のアプリやエージェントを構築・展開するための新しいインフラを整えることが必要です。その基盤を選定する際は、まずアプリ開発の構造変化を理解し、ハイパースケーラーの限界を把握し、不可欠な要件を定義することが重要です。しっかりとした基盤を用意することで、ビジネス目標を達成し、顧客の期待に応えるアプリやエージェントを構築できます。


AIとナノサービスが変えるアプリ開発

これまでのように、すべてのユーザーに同じ体験を提供する、大規模なモノリシックアプリケーションを構築する時代は終わりを迎えつつあります。現在、アプリ開発の世界では、「AIを活用して高度にパーソナライズされたエクスペリエンスを構築する」、「新しいアーキテクチャモデルを採用してアプリを構築および配信する」という2つの主要なトレンドが連携して新しいパラダイムを生み出しています。

1. AIを活用したハイパーパーソナライゼーションへの注力

これからのアプリ開発では、すべてのユーザーに同じ内容を提供するような、ユーザーにとっては無関係な情報の多い一律の体験では通用しません。現在の顧客は、小売金融サービスゲーミングなどの分野を問わず、自身の正確な好みや興味を反映した、魅力的な体験をアプリに求めています。

AIアプリやAIエージェントを使用すれば、超パーソナライズされた体験を、手作業による開発作業を増やす必要なく、大規模に実行できます。

例えば、あなたの会社がカレンダーソフトウェアを提供しているとしましょう。顧客が子どものサッカーの試合などの特定のイベントを自動でスケジュールできるようにしたい場合、各個人に割り当てられたAIエージェントが、リーグのオンラインイベントカレンダーから試合情報を収集して個人のカスタムカレンダーに反映させることができます。AIエージェントを使用することで、このような個別化された体験を数千から数百万の顧客に提供できるのです。

2. ナノサービスへの移行

AIアプリやAIエージェントによって高度にパーソナライズされた体験を実現する流れは、ソフトウェア開発そのものの大きな変化によってさらに加速しています。モノリシックアプリからマイクロサービスに移行した後、開発者は「ナノサービス」モデルを採用しています。ナノサービスでは、アプリの機能をマイクロサービスよりもさらに小さく、より独立した単一目的コンポーネントに分割します。マイクロサービスのアプローチと同様に、ナノサービスは開発のスピードアップ、アプリケーションの耐障害性向上、さらに高度なパーソナライゼーションも実現します。

各ナノサービスに分割されたコンポーネントは、それぞれエージェントとして機能し、非常に特定された個別のタスクを実行します。このアーキテクチャを採用することで、一つのアプリを多くのユーザーに使用させるのではなく、何百万単位の人にそれぞれにカスタマイズされたエージェントを提供することができます。

このアーキテクチャモデルにAIを統合することで、エージェントを活用して、個別化された体験を大規模に提供できます。ユーザーからの入力(プロンプト、閲覧履歴、チャットでのやり取りなど)を大規模言語モデル(LLM)に渡し、その出力結果に基づいてパーソナライズされたタスクを実行できます。プロセスを一度実行して終了することも、何百万回も使用することも可能です。

ナノサービスとAIを組み合わせることで、ユーザーに提供できる体験が根本的に変わる可能性があります。ただし、こうしたナノサービスやAIの利点を最大限に活かすのは、一般的なハイパースケーラーの環境では難しいのが現実です。


AIアプリの基盤としてハイパースケーラーを使用する際の限界

一般的に、従来のオンプレミス環境よりも柔軟性があり、費用対効果が高いため、多くの企業からアプリの構築や配信にハイパースケーラーが好まれることは当然のように思えます。しかし、AIの基盤として考えた場合、スケーラビリティの制約、ステートレス性、セキュリティ、コストの面で大きな課題があります。

スケーラビリティ

ハイパースケーラーは、一つのアプリを数千のユーザーに配信するスケーリングの面で優れていますが、数百万規模のユーザーそれぞれに独立したアプリやエージェントを効率的に提供するためのアーキテクチャは備わっていません。

また、そうした個別アプリやエージェントを短時間で立ち上げたり停止したりする自動化プロセスも十分ではありません。例えば、サッカーシーズンが始まると同時に、何千人ものユーザーから試合予定を管理するAIエージェントの需要が急増する場合があります。このとき、それぞれのエージェントをミリ秒単位で同時に立ち上げ、シーズン終了時の需要の終焉に合わせて即座にアプリを停止させてリソースを解放する必要があります。

しかし多くのハイパースケーラーでは、アプリごとのリソースの割り当てを手作業で行う必要があります。これらの環境は、多数の個別にカスタマイズされたアプリを効率よく運用できる仕組みにはなっていません。

ステートレス性

ハイパースケーラーは、AIエージェントの実行に必要なステートフル性を提供できません。AIエージェントは、セッションを跨いで、コンテキスト、ユーザーの好み、およびユーザーとのインタラクションを記憶しておく必要があります。ステートフルな環境であれば、ユーザーは最初からやり直すことなく、前回中断した場所から作業をすぐに再開することができます。この機能は、長期間非アクティブであった場合でも同様に働きます。

しかし、ハイパースケーラーはステートフル性よりもスケーラビリティと信頼性を優先しているため、需要の変化に応じてリソースを容易に追加または削除でき、問題発生時には迅速に交換できるように設計されていますが、この代償として、メモリにデータを保持する仕組みがありません。

セキュリティ

ハイパーパーソナライズされたAI搭載アプリやエージェントを作成する際は、あるユーザーのアプリ/エージェントのデータが、他のユーザーに決してアクセスされないようにする必要があります。例えば、AIエージェントで子どものサッカーのスケジュールを管理している場合、他人がその位置情報にアクセスできないようにする必要があります。

しかし、ハイパースケーラーは、ナノサービスベースのエージェント向けに設計されたアプリケーションアーキテクチャを提供していないため、各エージェントを適切に保護できません。AIアプリやAIエージェントを構築している場合、プロンプトインジェクション、安全でない出力処理、データポイズニング、サプライチェーンの脆弱性など、AIモデルが直面する広範な脅威から保護する必要もあります。すべてのハイパースケーラーが、これらの脅威やその他の脅威に対処するのに十分な組み込みのセキュリティ機能を備えているわけではありません。

加えて、開発者がLLM(大規模言語モデル)を使用してコードを自動生成する、いわゆる「バイブコーディング」を行う場合、AIモデルが意図せず脆弱性を組み込むリスクにも注意が必要です。

コスト

ハイパースケーラー上でAIアプリを運用すると、コストが急速に膨らみます。ハイパースケーラー上ではAIモデルへのすべての入力と出力に対して課金されます。リソースがリクエストを処理せずにただ割り当てられているだけでも、その時間に対して課金される場合があります。例えば、サッカーのスケジュールを追跡するAIエージェントが、試合時間や場所の更新の有無を確認するためにリーグのオンラインカレンダーを繰り返しチェックするとします。アプリがユーザーの入力や外部ソース(リーグのオンラインカレンダーなど)から応答を待機している時間も、リソースが予約されていれば課金の対象となります。

また、データに高額なエグレス料金が発生する場合もあります。ハイパースケーラーがユーザーへのデータ配信やデータ転送を別のクラウドプロバイダーを介して行う場合、この通信にも料金が発生します。クラウド内部での転送であっても、地域をまたぐ場合はエグレス料金が発生する可能性があります。


AIプラットフォームを選定する際の4つの重要な基準

AI搭載アプリを構築および実行するためのウドプラットフォームを選定する際には、4つの重要な要件があります。

1. 多対多の拡張性

まず、プラットフォームには、ハイパーパーソナライズされたAIアプリやエージェントを実現するナノサービスをサポートできるアプリケーション層が必要です。ユーザーごとに最適化された数百万ものアプリやエージェントを同時に実行して、ユーザーに近いエッジで配信する必要があります。そして、それらのアプリを数ミリ秒で自動的に起動または停止できることが理想です。

2. ステートフル性

プラットフォームには、数分、数時間、数日、または数週間にわたり、メモリ内でコンテキストを保持するステートフルエージェントを構築できる機能が必要です。従来のステートレスなサーバーレスアーキテクチャとは異なり、ステートフルなプラットフォームを使用することで、一度中断したやり取りを途中から再開でき、複雑で長時間実行されるタスクの処理も可能になります。

3. 組み込み型のアプリセキュリティ

AI開発に最適なプラットフォームは、アプリやエージェントにセキュリティを容易に組み込めることが重要です。このようなプラットフォームは、機密データを保護するための安全で独立したナノサービスを作成でき、さらに、バイブコーディングを行う際にも、発生する可能性のあるデータ漏洩、プロンプトインジェクション攻撃などの脅威を防止できるツールを提供します。

4. 過剰な料金からの解放

基盤となるAIプラットフォームは、AIアプリの実行コストを最小限に抑えるための複数の方法を提供するものである必要があります。例えば、AIモデルの応答をキャッシュすることで、同じ入力が繰り返された場合にAIモデルを複数の呼び出すことが無くなるため、かかるトークン料金を削減できます。

また、プラットフォームは、アプリやエージェントが入力や応答を待機する際の「ウォールタイム」に料金が発生しないことも重要です。アプリが実際に処理を行っている時間に対してのみ、料金が発生されるべきです。さらに、データを他のストレージ環境へ移動する際のデータ転送にかかるデータエグレス料金も発生しないことが重要です。


AIの基盤を構築する

Cloudflareは、AIを活用したアプリとエージェントを構築、実行および保護するための、スケーラブルで安全かつ費用対効果の高い基盤を提供します。Cloudflareは、AI開発を加速するプラットフォーム、AI搭載エージェントを構築するためのSDK、AIアプリを保護するためのセキュリティサービス、およびエグレス料金なしで急速に増大するデータセットを保存するためのオブジェクトストレージなど、AIアプリとAIエージェントの開発を合理化する幅広いサービスポートフォリオを提供しています。

特筆すべきは、Cloudflareプラットフォームは、数百万もの高度にパーソナライズされたアプリやエージェントの構築とスケーリングを可能にするナノサービスモデルをサポートするように設計されている点です。また、セッション間でコンテキストを保持するために必要なステートフル性も提供します。また、ハイパースケーラーがアプリの構築、保護、デプロイのために複数の異なるサービスをつなぎ合わせるのに対し、Cloudflareはすべての機能を単一の統合コネクティビティクラウドプラットフォームで提供します。Cloudflareのグローバルネットワークにより、個々のユーザーの近くでこれらのアプリやエージェントを実行でき、高速かつ遅延の少ない体験を実現します。

CloudflareをAI基盤として活用することで、革新的かつ高度にパーソナライズされたアプリケーションやエージェントを、迅速、安全、かつ費用対効果の高い方法で構築し、提供することができます。その基盤を整えることで、リスクを軽減しつつ、AIの投資効果(ROI)をさらに最大化することが可能になります。

この記事は、技術関連の意思決定者に影響を及ぼす最新のトレンドとトピックについてお伝えするシリーズの一環です。



このトピックを深く掘りさげてみましょう。

セキュリティを強化しながら企業におけるAIの利用をサポートする方法について、詳しくは、「AIの安全な実践を確保する:スケーラブルなAI戦略を立てる方法に関するCISO向けガイド」をご覧ください。





記事の要点

この記事では、以下のことがわかるようになります。

  • AIとナノサービスが変えるアプリ開発

  • ハイパースケーラーではAIアプリを十分に支えられない理由

  • AIアプリ開発プラットフォームに求められる3つの要件


関連リソース


大人気のインターネット関連インサイトの要約を毎月お届けします。