人工智能(AI)大模型的誕生,讓2023年成為人類歷史上一個重要年份——通用人工智能元年。這意味著以智能革命為代表的第四次工業革命已然
到來,人類站到了智能時代的門檻上。
人類所經歷的前三次工業革命,都令人類文明實現了新的飛躍,也對世界格局產生了深遠影響。長遠來看,人工智能在很多方面的智慧能力將可能
超過人類,但目前通用人工智能還需邁過多道門檻,才能真正實現強人工智能。
日前,中國科學技術大學知識計算實驗室提出了新的知識模型“知識方程”,并以此為基礎建立新型專家系統,通過與深度學習的結合,嘗試突破現
有通用人工智能的技術瓶頸。
人工智能(AI)誕生至今只有短短60多年,但其發展經歷了幾度跌宕起伏。近年來,深度學習技術為AI帶來了新的革命,其中包括我們熟悉的Alpha
Go、ChatGPT等。
當前AI技術在很多任務上取得了超越人類的成效,包括人臉識別、語音識別、字符識別等,在機器翻譯、問答和醫療診斷等領域也交出了令人相對滿
意的答卷??梢哉f,AI已經邁入能夠大規模落地應用的階段。
不過,當我們試圖將人工智能再向前推進,就會發現要克服其現有缺陷,還有待技術模式的創新與突破。
當下大模型面臨4個關鍵缺陷
OpenAI公司推出的ChatGPT是一個AI聊天機器人程序,更是一個人工智能自動生成內容(AIGC)的工具。作為一個對話系統,ChatGPT具備出色的
多功能性,無論是暢聊多種話題、解答數學題,還是提供禮品選擇建議、制定行程規劃,都可從容應對。因此,從某種意義上來說,ChatGPT具備了
廣泛的應用潛力和靈活性,可以說是一個通用人工智能(AGI)程序。
盡管在某些方面(例如邏輯和語義理解等)的評測表明,ChatGPT并非在所有領域都比現有的最佳模型更強大,但現有的最佳模型可能只是針對特定
任務而設計,而ChatGPT則是一個通用模型。
其實,多年前人們就認識到大模型的巨大潛力,但其實際發展速度仍比預想中快了許多。ChatGPT大模型甫一問世,很快就在應用層面受到極大關注。
半年后,中國就涌現出了百余個大模型。
目前,大模型的應用主要分為生成式人工智能(AIGC)、大模型輔助工具、個人智能交互3類。其中,個人智能交互尤其值得關注。任何真正能促進交
互的技術和產品都能產生巨大價值。這種交互不僅包括“人—人”(通過機器),也包括“人—機”,甚至包括“機—機”。而人工智能,包括大模型,
有望在這方面取得顛覆性突破。
然而,目前大模型的應用之路并不如想象的那么順利。根本原因在于,雖然大模型很強大,但仍然在技術上存在一些關鍵缺陷。
首先,大模型有時會犯事實性錯誤,也就是可靠性問題(俗稱“幻覺”)。例如,它會弄錯詩詞作者。從原理看,大模型的答案選擇基于概率,所以很難
保證百分百正確。這一問題在目前許多領域的大模型中都存在,也是大模型面臨的最重要的挑戰之一。
第二,大模型的數學和邏輯推理能力仍然需要加強。雖然GPT-4在某些考試中表現優異,但在面對一些精心設計的邏輯推理問題時,大模型的回答與隨機
答案相差無幾。因為在進行深度推理時,即便大模型每一步的預測準確率都高達95%,但是當推理到20步時,最終的準確率將會是0.95的20次方,即不到
36%,這是一個無法令人滿意的結果。
第三,大模型的形式語義理解能力有待提升。雖然大模型在一定程度上能夠實現語義理解,但要想真正從意義和形式上完全理解語言背后的意義,還有很
大的改進空間。
最后,大模型作為一個黑盒模型,存在一些通用弱點。比如,其可解釋性、可調試的能力較弱等。
通向強人工智能或需另辟蹊徑
大模型開啟了通用人工智能落地應用的窗口。但正如前文所說,技術上的一些關鍵缺陷意味著它與通用強人工智能之間尚有很大距離。要縮短這個距離,
至少有兩條不同路徑值得探索。
第一條路徑就是繼續沿著大模型現有的發展路線向前走。AI誕生不過60多年,GPT真正開始訓練至今也只有5年。如果讓大模型再發展5年、50年、500年
,它會取得怎樣的進步?這是一個值得思考的問題。
沿著現有技術路線,大模型的發展在兩個關鍵點上會遇到一定的挑戰。
其一,更多的參數。參數量的增加,會讓大模型的能力提升。摩爾定律表明,計算能力每18個月到24個月翻一番,而目前大模型的參數量正以三四個月翻
番的速度增長。因此,計算能力很快會跟不上模型的發展需求。而且,盡管參數量呈指數級增長,但其效果只呈線性增長。
其二,更多的數據。優質訓練數據的增加,也會讓大模型的能力提升。然而,GPT-4已經利用了大部分目前我們能夠獲取到的高質量文本數據。因此,可供
大模型訓練的數據即將達到瓶頸。
所以,要在大模型體系內解決這些問題,就需要發展新的顛覆性技術,來突破結構化信息、陳述性事實、長鏈條推理、深度語義理解等方面遇到的瓶頸。
另一條通往通用強人工智能的路徑則有很大不同。
當前AI正在經歷從感知智能向認知智能的范式轉變。眾所周知,人類擁有兩套推理系統,即直覺思考的快系統和理性思考的慢系統??煜到y是一種底層、快
速、下意識、不加思索便可即刻得到結論的推理方式,就像人們在家里閉著眼睛也能找到洗手間的位置;而當我們面對陌生環境,想要找洗手間時,則需要
依賴慢系統進行慎思,這種推理相對較慢、能耗較高,但更精確。
目前的大模型更多涉及到的是快系統層面的推理,慢系統推理能力表現還不佳。所以,人們自然而然就會想到,能否將這兩個系統結合起來。
事實上,上一波AI浪潮就是由專家系統驅動的。專家系統是一種類似于人類慢系統的推理方式,它以符號的方式把專家的知識輸入機器,再通過自動推理,
使得機器能夠像專家一樣自動回答問題。
專家系統與大模型各有所長。前者在精確度、可解釋性、邏輯推理能力、語義理解能力等方面表現更佳,而后者在通用性、泛化性、不確定性知識、學習能
力等方面更具優勢。因此,專家系統與大模型有機結合,正好可以取長補短,這或是通往通用強人工智能的一條更好路徑。
融合兩大推理系統探索未來智能
中國科學家在專家系統與大模型結合的道路上,已經開始了探索。中國科學技術大學知識計算實驗室提出了新的知識模型“知識方程”,在此基礎上建立起
新型專家系統,并將其與深度學習相融合。
簡言之,知識方程分為建模和知識2個層面。在建模層面,知識方程將領域對象統一抽象成為個體、概念、算子3類語法元素,它們之間可以相互轉換、相互
融合。在知識層面,知識方程將所有知識統一表示成為形如“a=b”的知識等式?;谥R方程,我們提出了基于新的數據與知識雙輪驅動的、結合大模型
與推理引擎的智能信息系統范式。
隨著ChatGPT等大語言模型的興起,在原有以數據庫為核心的信息系統之上,大模型可從暗數據庫(文本、圖像、視頻等)中挖掘有效信息,并在一定程度
上進行推理與(輔助)決策。
事實上,這是信息系統的一次范式革命。在所有數據中,暗數據占到絕大部分。傳統的信息系統必須通過一些手段(包括人工、自然語言處理、計算機視覺
技術等),將“暗”數據轉換成數據庫中的“明”數據才能使用。這種轉換往往由于工程和成本等問題,只能處理暗數據中的極小部分。而大模型可以直接
基于暗數據得以輸出,具有很強的暗數據處理能力。
基于大模型的信息系統類似于人類用于直覺思考的快系統,能在一定程度上直接基于大數據進行推理與決策。但由于大模型目前存在的技術缺陷,在很多應
用場景并不能直接滿足應用要求。中科大知識計算實驗室所提出的大模型增強技術,可構建領域本體與知識庫,在此基礎上融合大模型與知識推理引擎,研
發知識數據雙驅動的智能信息系統框架,將思考的快系統與慢系統結合起來。與單純的大模型相比,該框架具有正確性、可靠性、可解釋性、可調試性等優
點,能夠顯著提高大模型在各行各業的應用價值。
除了數據庫和暗數據庫,該系統還可有效利用知識庫的信息。因此,該框架有望引領大模型之后的又一次信息系統范式革命,也將成為智能信息系統的新形態。
從應用角度看,通用強人工智能無論在廣度,還是在深度方面,都是現有的大模型技術無法比擬的。從長遠來看,人工智能在很多方面的智慧能力可能會超
過人類,不僅是計算、記憶和存儲等基礎智能,還可能包括決策、預測、創新等高階智能。隨著基于計算的大模型和知識推理引擎的不斷發展,AI也將越來
越接近甚至超越人類,這將在極大程度上推動生產力。
(作者周熠 系中國科學技術大學教授、知識計算實驗室主任)