原文作者:由 McAfee Enterprise 的首席技术专家、云原生安全负责人 Vishwas Manral 撰写
译者:BlueDog
概述#
由於 OpenAI 發布了面向消費者的聊天機器人 ChatGPT,該機器人利用生成式人工智能技術,大型語言模型(LLMs)引起了廣泛關注。ChatGPT 對企業和公司產生了巨大影響,開源人工智能生態系統也同樣如此
雲服務提供商一直處於領先地位,微軟 Azure 通過其平台和認知服務提供 OpenAI API,並在其平台內集成其他 OpenAI 平台。谷歌創建了一個名為 Bard 的類似 ChatGPT 的聊天機器人,並通過其 Vertex AI 平台提供生成式人工智能功能。亞馬遜也與其 SageMaker 平台合作
雖然我們還處於人工智能的早期階段,但有一點是清楚的:雲計算是生成式人工智能平台的支柱。企業和公司將在雲上使用並創建大部分他們的生成式人工智能應用程序
基礎內容#
在我們進一步深入之前,讓我們先了解一些基本術語
人工智能 - AI是機器模仿智能人類行為的能力。像 “蘋果 Siri” 或 “亞馬遜 Alexa” 這樣的聊天機器人被認為是人工智能,它們可以用人類的聲音進行對話
機器學習 - ML是應用於 AI 的一種方法,它幫助我們從經驗中學習和改進。它是計算機科學的一個學科,使用計算機算法和分析來構建預測模型以解決業務問題
深度學習是機器學習的一個子集,涉及到受到人腦結構和功能啟發的算法。深度學習算法可以處理大量結構化和非結構化數據。深度學習的關鍵點在於表示性學習,即自動地學習特徵,並且每個層次都會創建更抽象、綜合性更強的數據表示
生成對抗網絡 - GANs是通過將問題框定為具有兩個子模型(生成模型和判別模型)之間監督式訓練問題而巧妙地訓練生成模型的方法:我們訓練生成器模型來生成新樣本,並且判別器模型試圖將樣本分類為真實領域中的樣本還是生成的(虛假的)。
生成式人工智能是一類用於創建新內容的 AI 模型和工具。它使用諸如 GANs 和變換器(Transformer)模型等機器學習技術,從大規模數據集中學習並生成獨特的輸出
AI 服務提供商 - AISP是一種為用戶提供 AI 服務的實體,幫助他們構建 AI 應用程序。這些實體可以是雲提供商,如 AWS、GCP 和 Azure,也可以是其他專業提供商
AI 服務使用者 - AISU是使用 AISP 提供的服務來為用戶構建 AI 應用程序的實體。這些實體通常是企業、中小型企業、初創公司甚至個人開發者
大型語言模型 - LLM是基於深度學習的語言模型,在大量語言數據上進行訓練。這些語言能夠產生類似人類的語言輸出,並執行複雜的自然語言處理任務
提示機制使得用戶 / 軟件可以使用自然語言與生成式 AI 模型交互。它由給出指令組成,以便要求生成式 AI 提供所需輸出
接地化過程為生成式 AI 模型提供上下文信息,強制其根據上下文回答而不會產生幻覺。通過訪問客戶特定數據來進行接地化有助於生成具有相關背景信息響應
檢索增強接地化 - RAG是一種知識接地化形式。它採用微調配方將預先訓練好的模型數據與附加上下文相結合
共擔責任模型#
NIST 800-145 定義了雲服務的服務模型,包括 IaaS、SaaS 和 PaaS。這些模型已經發展並衍生出許多更多的服務模型。以下是演變後的共享責任模型鏈接,其中包括容器即服務和無服務器
隨著生成式人工智能應用程序在雲上構建,共享責任模型也可以擴展到生成式人工智能應用程序
生成式人工智能應用#
生成式人工智能應用可分為基礎設施即服務(IaaS)、平台即服務(PaaS)和軟件即服務(SaaS)
IaaS 應用案例#
對於生成式人工智能 IaaS 應用,AISUs 選擇基礎模型並使用自有專利數據進行訓練。應用程序使用已經訓練好的模型,並向用戶提供訪問權限。這些主要是針對關鍵商業應用程序,如 BloombergGPT、Einstein GPT 和 Intuit GenOS 等公司為滿足客戶需求而創建的應用程序
PaaS 應用案例#
AISUs 正在使用 Azure OpenAI (或 Google Vertex AI APIs) 等服務創建 PaaS 應用。 AISPs 將已經訓練好的模型託管在租戶自己的基礎架構中。使用生成式人工智能非常類似於專門的 API 調用,適合大量由 AISUs 構建其應用程序所採取的模型
SaaS 應用案例#
現在有很多現有 SaaS 應用包括了生成式人工智能功能。像 Microsoft365、ServiceNow 和 Salesforce 這樣知名企業級應⽤都具備了生成式人⼯智能功能。所有與 AISUs 相關聯的模型、培訓和理解都不會被暴露。還有一些類似於 ChatGPT 的應用程序正在構建,這些應用程序專注於生成式人工智能。企業需要能夠檢測到這些影子應用程序,並找到保持其使用安全的方法
生成式人工智能共享責任模型#
AI 應用的安全和合規責任由 AI 服務用戶、企業(應用程序所有者 )和 AI 服務提供商共同承擔。這種共享責任模型有助於劃分並明確職責分工,使新的 AI 應用能夠更快地創建和部署,同時保持安全性和合規性
IaaS 職責#
對於 IaaS 應用程序,包括 GPU、訓練或推理基礎設施的基礎架構由 AISPs 提供。 AISU 負責物理和虛擬基礎架構的安全性。 AISPs 可以提供經過策劃的 AI 基礎模型或預訓練模型。使用任何開源或專有數據語料庫,AISUs 可以對模型進行培訓和調整。選擇模型譜系和相關性是 AISU 的責任。需要通過 AISU 驗證用於培訓模型的數據語料庫及其淵源和安全性需求。該模型由 AISU 托管以進行推理處理。當應用程序運行時,所有提示過濾和接地(上下文回答)都由 AISU 提供支持。提示控制、應用程序安全 / 知識產權(IP)以及版權等方面均由 AISU 本身處理
PaaS 職責#
對於 PaaS 應用程序,基礎架構以及預先訓練好的模型均由 AISP 提供支持。該模型所依賴數據集合與其安全性是 AISP 的職責範疇內 。該模型由 AISP 自行托管。如果一個模型是針對特定任務進行 訓練的,則 AISP 可以在用戶特定的上下文中進行一些接地,而 AISU 則負責其他方面。應用程序安全 / 知識產權(IP)和版權等方面均由 AISU 本身處理
SaaS 職責#
對於 SaaS 應用程序,LLM 模型被從 AISU 中抽象出來,並由 AISP 負責。SaaS 應用程序使用在 SaaS 應用程序內的用戶特定上下文以及從其他應用獲取的其他數據來接地該模型。應用程序安全性、大部分提示過濾和 IP 過濾都是 AISUs 的職責範疇內
結論#
雖然 AI 服務模型將會不斷發展,共擔責任也會隨之變化,但本文試圖提供一些早期術語和框架,以幫助清晰劃分 AI 服務提供商和 AI 服務用戶的職責範疇,使他們能夠獨立快速地工作