OUTLOOK 科技發展觀測平台

科技議題

首頁> 科技議題 - 智慧科技> 美國人工智慧安全研究機構：願景、使命與策略目標

美國人工智慧安全研究機構：願景、使命與策略目標 The United States Artificial Intelligence Safety Institute: Vision, Mission, and Strategic Goals

出版年

2024/05

出版機構

United States Artificial Intelligence Safety Institute

連結網址

https://www.nist.gov/system/files/documents/2024/05/21/AISI-vision-21May2024.pdf

摘要

一、前言

2024年5月美國商務部發布AI安全研究所(Artificial Intelligence Safety Institute, AISI) 戰略願景，並宣布與全球合作的計畫，以促進安全和負責任的AI創新。人工智慧安全研究所(AISI) 為美國國家標準技術研究所(NIST)旗下組織，其建立的目標旨在追求「安全」的AI。在AI成長爆發的時代，AISI透過短期與長期的研究目標，設定完整的AI防護策略。藉由研究、測試、訂立發展策略與國家遵循標準等措施來防止AI的發展損害人類權益。以下章節將會針對AISI所推出的政策目標加以說明。

二、人工智慧安全研究所之策略目標

(一) 促進AI安全科學發展，建構AI安全網的願景
AISI的目標一將推動基於實證的測試、基準和評估人工智慧模型、系統和代理程式，尋求短期和長期人工智慧安全挑戰的實際解決方案。而這個目標有以下重點：
(1) 改進或建立所需的安全指南和技術安全工具，例如檢測合成內容的技術、模型安全的最佳實踐，以及模型、系統和代理程式級別的技術保護和緩解措施。這些項目可能涉及基礎研究和應用研究。
(2) 進行AI模型部署前的測試、評估與驗證（Test, Evaluation, Validation, Verification, TEVV），以評估潛在和新興風險。這些項目旨在評估先進的人工智慧系統在部署或發布之前可能產生的風險，利用自動化能力評估、專家紅隊測試、A/B測試等方法進行。檢測範疇包括對個人權利、公共安全和國家安全的風險，例如可能促使化學、生物或網路攻擊的風險，以及對人類監督或控制的風險。
(3) 此外，AISI也會與NIST實驗室、美國政府機構、國際合作夥伴和AI產業人士合作針對個人權利、公共安全和國家安全的已存在風險或潛在新興風險進行部署前評估，並擔任先進AI模型開發者間的主要溝通橋樑。

(二) 闡明、展示和擴散AI安全的實踐，使願景目標可被執行
人工智慧安全不僅依賴於科學的發展，還依賴於科學的實踐。因此，目標二的項目包含：
(1) 建立並發布用於評估不同領域和部署情境下，先進人工智慧風險的具體指標、評估工具、方法論指南、協議和基準。AISI計劃在此目標下發布開發者和部署者，可用於評估各種風險的TEVV指南和工具，包括用於一系列風險的TEVV的具體評估協議，以便為開發者、部署者和第三方獨立評估者提供資訊和支持。
(2) 建立並發布風險應對指南和安全機制，以建構先進人工智慧模型、系統和代理程式在設計、開發、部署、使用和治理上的責任歸屬設計。計畫範疇包含了現有的AI危害以及潛在新興風險的應對指南，尤其針對公共安全和國家安全的風險。
(3) 通過利用在目標1中討論的科學研究和開發項目，AISI打算為人工智慧產業的利害關係人（包括從模型開發者、評估者、部署者、用戶、以及可能AI影響的所有人），提供基於科學的風險評估與安全應對策略。

(三)支持關於AI安全的機構、社群和協作，使願景目標得以持續
在人工智慧系統的廣泛應用和日益增長的影響力下，AISI要求建立一個更加整合的人工智慧安全生態系統，包括各種學科、觀點和經驗。這個生態系統也將受益於對人工智慧模型、系統和代理程式進行第三方獨立的驗證。因此，AISI將執行以下項目：
(1) 推廣AISI的人工智慧安全措施和風險應對措施。為了最大程度地提高和利用AISI指南的價值和可用性，AISI打算發起社會間持續性的對話、資訊共享與合作。包含了安全研究實驗室、第三方評估者以及開發者、部署者和用戶之間的多元專業知識進行適當的合作。該項目旨在將承諾轉化為可行的指南，以建立人工智慧安全的最佳實踐方法。AISI的項目可能會為科學報告、文章、指南和實踐作出貢獻，以確保嚴格的人工智慧安全研究、測試，對主要國內人工智慧安全立法或政策產生影響。此外亦即希望透過AISI的影響力，推動全社會對人工智慧安全實踐的認識，包括了國家的研發單位以及公共和私營部門的人工智慧利害關係人。
(2) 領導一個具包容性的國際人工智慧安全科學網。成為其他人工智慧安全研究所、國家研究機構和OECD、G7等國際組織的合作夥伴。建立並發展共享的人工智慧安全評估和統一的風險應對措施。通過人工智慧安全標準的採納和建立，塑造健全的人工智慧安全生態系統，確保AISI在美國國內和國際上的影響力。

三、結論
為一項具有變革的技術建立安全準則是社會的共識。而這需要進行科學研究、落地實踐、各方協議及號召全社會參與。美國人工智慧安全研究所是聯邦政府應對這一呼聲的關鍵組織。AISI與人工智慧領域的產、官、學等專業人士與組織密切合作，致力於建立基於科學的指標、工具和指南，供政府和公眾用於評估人工智慧系統的風險，以促進安全的人工智慧創新。AISI在人工智慧安全科學領域的領導地位將催化美國國內和國際生態系統，確保在人工智慧的蓬勃發展下，你、我乃至於我們的未來世代，都將是人工智慧發展下的「安全」受益者。

摘要撰稿

吳庠澤

語文

英文