科技議題

首頁> 科技議題 - 智慧科技> 人工智慧的商業、 政府、研究、人才、創意領域和社會趨勢
人工智慧的商業、 政府、研究、人才、創意領域和社會趨勢 Artificial Intelligenc: Artificial Intelligence Trends in Business, Government, Research, Talent, Creative Fields and Society
2022/03
Future Today Institute
https://futuretodayinstitute.com/mu_uploads/2022/03/FTI_Tech_Trends_2022_Book01.pdf
一、2022年人工智慧發展現況
人工智慧代表了第三個電腦時代,此階段通常認為機器執行認知功能的能力將與人類相當甚至超越人類。人工智慧已廣泛的運用在許多產業中。用來解決業務問題、檢測詐欺行為、提高作物產量、管理供應鏈、推薦產品,甚至協助設計師和作家的工作。人工智慧能使藥物研發的過程自動化,使得本次新冠肺炎疫情中,能更快研發出候選疫苗。由於人工智慧的應用十分廣泛,因此該報告將以不同的主題來探討,在未來今日研究所2022年所發布的13份報告,幾乎所有趨勢都與AI相關。自2015年發布第一份技術趨勢報告以來,未來今日研究所不斷擴大對人工智慧討論,從最初的幾頁擴大到現在的獨立專門報告,其中包含了100多個追蹤趨勢。該研究所認為人工智慧能夠在技術發展之餘,同時推動商業、政府與社會的發展。人工智慧已大幅改變了經濟活動,且持續將對醫療保健、生物技術、雲端運算、金融科技、消費性電子產品和軍事產生更深遠的影響。此份報告首先探討2022年人工智慧技術與具影響力的模型,接著介紹已AI為核心的企業趨勢、消費者趨勢、在創造領域的趨勢、健康醫療與科學趨勢、研究趨勢、人才與社會,下列僅摘錄部分內容。

二、2022年人工智慧技術觀察
(一) 自動化機器學習(Automated Machine Learning)
自動化機器學習透過將原始資料和模型融合以顯示最相關的訊息,從而擺脫傳統的機器學習方法,Google、亞馬遜和微軟在其雲端服務中都包含了大量自動化機器學習產品。
(二) 人工智慧的持續學習(Continuous Learning)
目前深度學習技術正在幫助系統學習以類似於人類可以完成的方式來解決複雜的任務,但目前仍侷限於特定任務,且需要遵循嚴格的工作序列進行:搜集資料、確定目標、部署演算法,此過程仍需要人工介入且十分耗時,尤其是在訓練初期的監督。持續學習是更著重於自主性,以及強化技能建構與發展,研究人員將持續推進此領域發展的可能極限。
(三) 聯邦學習(Federated Learning)
聯邦學習是一種將機器學習應用到極致的技術。Google研究人員於2016年推出一個架構,讓演算法能夠在不損害用戶隱私的前提下使用終端設備(如手機、智慧手錶)上的資料,且有關此方面的研究正急劇增加。
(四) 通用強化學習演算法(General Reinforcement Learning Algorithms)
是一種可以學習多項技術的單一演算法。AlphaGo背後的DeepMind團隊,開發出MuZero,具備不需事先說明規則即能掌握多種遊戲玩法的能力,這是在追求通用演算法方面的重要一步。2021年DeepMind團隊於《Reward Is Enough》期刊發表的論文中,假設僅透過強化學習就能實現人工智慧。
(五) 圖神經網絡(Graph Neural Networks)
圖神經網絡以圖為輸入進行操作,是一種特定類型的深度神經網絡。辨識與分類味道是相當棘手的工作,可利用圖神經網絡組成特定類型的深度神經網絡deep neural network),以分子預測氣味,可廣泛運用於化學及生物學中,例如Broad研究所的研究人員使用此技術發現無毒性副作用的抗生素化合物。
(六) 混合人機視覺
人工智慧目前仍需要在人類的協助下才能完全發揮作用,混合智慧系統便是將人類和人工智慧系統整合,以提高準確性。相關應用包含美國陸軍研究室所開發,配有電腦視覺技術的腦機介面系統;應用於影像說明的CloudSight,正致力於開發混合群眾外包的電腦視覺系統;微軟的混合人機方法及工具的故障分析系統—Pandora等。
(七) 機器影像修補
電腦系統透過資料庫中的圖像紀錄,修補和填補圖片中的缺漏,此功能很實用,但也可能存在重大的偏見或陷阱,例如圖像生成演算法通常反映了基於文化的種族主義和性別歧視,如Carnegie Mellon University自動影像修補人類頸部以下圖像,自動讓男性穿著西裝,女性則有53%機率是穿著低胸或比基尼。
(八) 強化學習(reinforcement learning, RL)的無模型方法
Dreamer是一個強化學習的媒介,運用全球模型學習具有遠見的預測並進行驗證,其從原始圖像開始創建模型,並利用圖形處理器(GPU)自數千個預測序列中學習,此法改善了過往利用想像的世界以預測未來任務的模式。
(九) 以不完整資料進行預測的模型
電腦視覺系統變得越來越聰明,神經網絡可從單色圖像預測幾何圖形,DeepMind團隊開發的生成對抗網路(Generative adversarial networks),可透過圖形建立影像,MIT的Computer Science and Artificial Intelligence Laboratory (CSAIL)開發的預測系統,能透過影像細節預測影像人物的下一個動作。未來,這項研究將讓機器人可輕鬆在充滿人類的環境中移動,並透過識別人們的肢體語言進行互動,零售、製造及教育環境都是重要的適用場域。
(十) 神經符號(Neuro-Symbolic)人工智慧
自1950年以來,人工智慧一直在符號(使用知識與規則作為基礎概念的機器)與非符號(使用原始資料建構自有模型並以此作為基礎的機器)兩個概念上發展,前者為目前典型的人工智慧,較接近我們所了解的人類思維模式。研究人員正在研究使用神經網絡將學習和邏輯結合起來的新方法,其能利用符號來理解資料,而非總是依賴軟體工程師為電腦分類、標記資料,透過神經符號演算法最終將使得系統不再總是倚賴人工訓練。
(十一) 即時機器學習(Real-time Machine Learning, RTML)
人工智慧目前面臨的重大挑戰是,需要建構一個能即時主動蒐集和解釋資料、發現模式和整合上下文並即時學習的機器。美國國家科學基金會啟動了一項1,000萬美元的計畫,以促進對該領域的研究,同時,所有大型科技公司也都在密切推動即時機器學習。
(十二) Vokenization
北卡羅來納大學的研究人員正將語言模型與電腦視覺相結合,利用人類多層次、多維的方式學習,創造了一種名為Vokenization的新技術,透過以前後文對照語言以推算僅語言(language-only)的資料,或是將用於訓練模型的詞彙,予以對應至圖片,讓機器不僅能夠識別物體,也能夠真正「看到」其所代表的意義。

三、2022年重要人工智慧模型
(一) DALL-E
由OpenAI所開發的,是利用語言產生視覺圖像的模型,由自然語言編寫提示開始,接著生成一組顯示相對應於含義的解釋圖像。
(二) GPT-3
同樣由OpenAI開發,能產生類似人類語言的龐大人工智慧,且幾乎無法區辨是由人工智慧所撰寫,研究人員利用GPT-3撰擬特定情境與字數限制的文章,並以匿名方式由教授批改,能獲得等級B的成績。但此AI系統展現出強烈的反穆斯林的偏見,這樣的偏見如何潛入人們發展的自動化系統值得研究,若任其發展,隨著人工智慧的成熟,將產生進一步的社會問題。
(三) Google的LaMDA和MUM
在2021年Google的I/O大會上,Google發表了能夠管理開放式對話的模型–LaMDA,其對話很自然,並能在起始對話後,持續對應後續開展出的各種對話。MUM模型則能夠在搜尋的過程中,使用自然語言(文本形式)和各種圖像來理解複雜的提問,未來也許可以透過MUM,以對話方式即能找到人們想要尋找的一切。
(四) Switch Transformer
2021年google展示新的語言模型架構,其將自然語言處理AI模型使用參數擴增至1.6兆,同時減少訓練時間,許多語言模型相當複雜,Switch Transformer的突破能降低運算成本、提高精準度及效率。
(五) 中文AI模型:悟道2.0及M6
為中文市場開發的兩款AI模型,相較於GPT-3等模型具有更大的運算參數量及降低成本的優勢。

四、企業趨勢
在未來十年之中,人工智慧將重塑知識經濟,將目前由人工進行的工作予以自動化,並進一步強化服務效能。相關技術及發展趨勢包含機器人流程自動化、簡化甚至不需寫程式的機器學習、部署經預先訓練的翻譯模型、自然語搜尋系統、網路內容分析、無伺服器運算、雲端人工智慧、邊緣人工智慧(將人工智慧導入終端產品中)、進階AI晶片、記憶體內部運算、流程機器人的發展、工作場所災害與問題預測、人工智慧保險、人工智慧行銷、人工智慧物流等。

五、地緣政治趨勢
各國對於AI發展的推動與限制,不但影響著AI技術的未來,也對地緣政治產生交互影響。歐盟提出的人工智慧法案(AI Act),對人工智慧進行分類及規範,通過後,將限制遠端生物特徵分析等AI技術的應用。人工智慧也激發了國家間的民族主義,以避免人工智慧技術在商業併購及投資中,遭到國外競爭對手所利用。同時,許多國家也都紛紛制定人工智慧的國家戰略,定義並維護國家人工智慧的發展方向與技術。各國間對於人工智慧的推動與保護也加劇了地緣政治間的緊張局勢,以歐美為首的西方國家可能逐漸形成聯盟,而俄羅斯及中國則可能單獨合作。
在人工智慧的應用方面,許多國家都將其應用於關鍵基礎系統中,利用人工智慧進行防災工作並提高安全性。另一方面,有鑑於人工智慧的發展所帶來的自動駕駛事故、虛假訊息、深度偽造等對於國家社會的影響,各國也逐漸加強管理規範。但由於各國規範的不同,也將使得人工智慧全球合作的可能性下降。

六、研究趨勢
(一) 超大型AI模型(Supersized AI Models)
2021年,更多超大型的AI模型,如GPT3擁有1750億個參數;Huawei首次發布的語言模型Pangu則有2000億個參數;Baidu與鵬城實驗室合作的PCL-BAIDU Wenxin有2800億個參數;2021年DeepMind的Gopher亦有2800億個參數:微軟與Nvidia,合作的Megatron-Turing NLG有5300億個參數;Google的Switch-Transformer與GLaM各有1兆與1.2兆個參數;北京智源人工智慧研究院有1.75兆個參數。
(二) 整合學習過程
研究人員開發的Data2vec系統,以單一演算法訓練神經網路,辨識圖片、文本與演說,透過自我監督學習,整合學習過程,不須輸入標籤資料,即能讓神經網路利用自身資料庫辨識模式。
(三) 無文本自然語處理(Textless NLP)
多數大型語言模型是利用公開資料庫,如Reddit與維基,而兩者都有偏見。研究人員正開發可利用無給予標籤的原始影片,即可進行生成口語建模(generative spoken language modeling),以強化AI包容性。
(四) 封閉原始碼的程式碼(Closed-Source Code)
多數學術研究人員在發布論文時,並未提供原始碼,原因為涉及其他專利研究,僅有2成論文會同步公開全部原始碼,大型機構DeepMind與OpenAI則註記專利考量,將其留白。
(五) 架構合併
Google的TensorFlow與臉書的PyTorch是相當受研究者歡迎的兩種AI框架,不過在過去5年,研討會論文其使用的架構為PyTorch的比例達75%,從TensorFlow轉換成使用PyTorch的研究者達55%。
(六) 機器學習訓練模型成本降低
模型訓練成本花費高,如OpenAI的GPT-3訓練模型花非超過1000萬美元,部分小型研究團隊與企業往往難以負擔,轉而使用大型企業預先訓練或發佈的模型。
(七) AI的發展超越人類自然語言的基準
通用語言理解評估(General Language Understanding Evaluation)基準是蒐集訓練、評估與分析自然語言理解系統的一套資源,人類的分數約為87分,NLP系統得分從2018年的60分,大幅成長至2020年的96分。
(八) 不再需要重新訓練
訓練機器人執行超過一項任務是很困難的,不過Open AI的模型能讓機器人處理新類型的難題而不需要重新訓練。
(九) Franken演算法的擴散
演算法是基於定義與規則,以自動化處理資料,通常是建立在「如果這樣,則那樣」的電腦能理解與處理的邏輯,不過許多演算法是獨立開發,當系統匯集多個演算法後,可能造成系統運作問題。
(十) 透過AI技術實現文件自行摘要統整
艾倫人工智慧研究所(Allen Institute for Artificial Intelligence)利用AI科學論文搜尋引擎Semantic Scholar,能利用長篇論文提供高正確率的摘要。
黃奕嘉
英文