概要#
OpenAI は、生成 AI 技術を利用したコンシューマ向けチャットボット ChatGPT をリリースし、大規模な言語モデル(LLM)が広く注目されています。ChatGPT は、企業や組織に大きな影響を与え、オープンソースの AI エコシステムも同様です。
クラウドサービスプロバイダーは常に先導的な立場にあり、Microsoft Azure はプラットフォームと認知サービスを通じて OpenAI API を提供し、他の OpenAI プラットフォームを統合しています。Google は Bard という ChatGPT に似たチャットボットを作成し、Vertex AI プラットフォームを通じて生成 AI 機能を提供しています。Amazon も SageMaker プラットフォームと連携しています。
AI はまだ初期段階にありますが、クラウドコンピューティングは生成 AI プラットフォームの基盤です。企業や組織はクラウド上で生成 AI アプリケーションを使用し、作成することが多いでしょう。
基本内容#
さらに進む前に、いくつかの基本的な用語を理解しましょう。
** 人工知能(AI)** は、機械が人間の知能を模倣する能力です。"Apple Siri" や "Amazon Alexa" などのチャットボットは AI と見なされ、人間の声で対話することができます。
** 機械学習(ML)** は、AI に適用される手法であり、経験から学習し改善するためのものです。これはコンピュータ科学の一分野であり、ビジネスの問題を解決するためにコンピュータアルゴリズムと分析を使用して予測モデルを構築します。
ディープラーニングは、機械学習の一部であり、人間の脳の構造と機能に触発されたアルゴリズムを扱います。ディープラーニングアルゴリズムは、大量の構造化および非構造化データを処理することができます。ディープラーニングの鍵は表現学習であり、自動的に特徴を学習し、各レベルでより抽象的で総合的なデータ表現を作成します。
** 生成対抗ネットワーク(GANs)** は、問題を 2 つのサブモデル(生成モデルと判別モデル)の間の教師ありトレーニング問題として定義し、生成モデルを巧妙にトレーニングする方法です。私たちは生成器モデルをトレーニングして新しいサンプルを生成し、判別器モデルはサンプルを実際のドメインのサンプルまたは生成された(偽の)サンプルとして分類しようとします。
生成 AIは、新しいコンテンツを作成するための AI モデルやツールの一種です。GAN や Transformer モデルなどの機械学習技術を使用し、大規模なデータセットから学習し、ユニークな出力を生成します。
**AI サービスプロバイダー(AISP)** は、ユーザーに AI サービスを提供するエンティティであり、彼らが AI アプリケーションを構築するのを支援します。これらのエンティティは、AWS、GCP、Azure などのクラウドプロバイダーである場合もありますし、他の専門プロバイダーである場合もあります。
**AI サービスユーザー(AISU)** は、AISP が提供するサービスを使用して AI アプリケーションを構築するエンティティです。これらのエンティティは通常、企業、中小企業、スタートアップ、個人開発者などです。
** 大規模言語モデル(LLM)** は、深層学習に基づく言語モデルであり、大量の言語データでトレーニングされます。これらのモデルは人間のような言語の出力を生成し、複雑な自然言語処理タスクを実行することができます。
プロンプトメカニズムは、ユーザー / ソフトウェアが生成 AI モデルと対話するために自然言語を使用できるようにするものです。それは指示を与えることで構成され、生成 AI に必要な出力を要求します。
グラウンディングプロセスは、生成 AI モデルに文脈情報を提供し、幻覚を生じさせずに文脈に基づいた回答を生成させるものです。顧客固有のデータにアクセスすることによってグラウンディングを行うことは、関連する背景情報を持つ応答を生成するのに役立ちます。
** リトリーバル・エンハンスド・グラウンディング(RAG)** は、一種の知識グラウンディング形式です。事前にトレーニングされたモデルデータを追加のコンテキストと組み合わせるためのファインチューニングのレシピを使用します。
共有責任モデル#
NIST 800-145 では、クラウドサービスのサービスモデル、IaaS、SaaS、PaaS などが定義されています。これらのモデルは進化し、さまざまなサービスモデルに派生しています。以下は、共有責任モデルの進化に関するリンクであり、コンテナサービスやサーバーレスなども含まれています。
生成 AI アプリケーションがクラウド上で構築されるにつれて、共有責任モデルは生成 AI アプリケーションにも適用されるように拡張されることがあります。
生成 AI アプリケーション#
生成 AI アプリケーションは、IaaS(Infrastructure as a Service)、PaaS(Platform as a Service)、SaaS(Software as a Service)に分類されます。
IaaS アプリケーションの例#
生成 AI の IaaS アプリケーションでは、AISU は基本モデルを選択し、独自の特許データを使用してトレーニングを行います。アプリケーションはトレーニング済みのモデルを使用し、ユーザーにアクセス権を提供します。これらは主に BloombergGPT、Einstein GPT、Intuit GenOS などの重要なビジネスアプリケーションに対して使用されます。
PaaS アプリケーションの例#
AISU は、Azure OpenAI(または Google Vertex AI API など)などのサービスを使用して PaaS アプリケーションを作成しています。AISP はトレーニング済みのモデルをテナントのインフラストラクチャにホストします。生成 AI の使用は、専用の API 呼び出しと非常に似ており、AISU がアプリケーションの構築に使用するモデルに適しています。
SaaS アプリケーションの例#
現在、多くの既存の SaaS アプリケーションには生成 AI の機能が組み込まれています。Microsoft 365、ServiceNow、Salesforce などのような有名な企業向けアプリケーションには生成 AI の機能が備わっています。AISU に関連するモデル、トレーニング、理解は公開されません。ChatGPT のようなアプリケーションも構築されており、これらのアプリケーションは生成 AI に特化しています。企業はこれらのシャドウアプリケーションを検出し、安全に使用する方法を見つける必要があります。
生成 AI の共有責任モデル#
AI アプリケーションのセキュリティとコンプライアンスの責任は、AI サービスユーザー、企業(アプリケーション所有者)、AI サービスプロバイダーの共同責任です。この共有責任モデルは、責任を分割し明確にするために役立ち、新しい AI アプリケーションの迅速な作成と展開を可能にしながら、安全性とコンプライアンスを維持します。
IaaS の責任#
IaaS アプリケーションでは、GPU、トレーニングまたは推論インフラストラクチャなどの基盤は AISP が提供します。 AISU は物理的および仮想的なインフラストラクチャのセキュリティに責任を持ちます。 AISP は計画された AI ベースの基本モデルまたはプリトレーニングモデルを提供することができます。オープンソースまたはプロプライエタリなデータコーパスを使用して、AISU はモデルをトレーニングおよび調整することができます。モデルのアーキテクチャと関連性の選択は AISU の責任です。モデルをトレーニングするためのデータコーパスとその起源およびセキュリティ要件を検証するために、AISU によって検証する必要があります。モデルは AISU によってホストされ、推論処理に使用されます。アプリケーションが実行されている間、すべてのプロンプトフィルタリングとグラウンディング(文脈に基づいた回答)は AISU によってサポートされます。プロンプトの制御、アプリケーションのセキュリティ / 知的財産(IP)、著作権などは、AISU 自体が処理します。
PaaS の責任#
PaaS アプリケーションでは、インフラストラクチャと事前にトレーニングされたモデルの両方を AISP がサポートします。モデルが依存するデータセットとそのセキュリティは、AISP の責任です。モデルは AISP によってホストされます。モデルが特定のタスクに対してトレーニングされている場合、AISP はユーザー固有のコンテキストで一部のグラウンディングを行うことができますが、他の側面は AISU の責任です。アプリケーションのセキュリティ / 知的財産(IP)および著作権などは、AISU 自体が処理します。
SaaS の責任#
SaaS アプリケーションでは、LLM モデルは AISU から抽象化され、AISP が責任を持ちます。SaaS アプリケーションは、SaaS アプリケーション内のユーザー固有のコンテキストと、他のアプリケーションから取得した他のデータを使用してモデルをグラウンディングします。アプリケーションのセキュリティ、ほとんどのプロンプトフィルタリング、および IP フィルタリングは、AISU の責任範囲内です。
結論#
AI サービスモデルは進化し続けるでしょうし、共有責任も変化するでしょうが、この記事では AI サービスプロバイダーと AI サービスユーザーの責任範囲を明確にするためのいくつかの初期の用語とフレームワークを提供することを試みました。これにより、彼らは独立して迅速に作業を進めることができます。