大模型技術(shù)興起,讓社會(huì )加速進(jìn)入了一個(gè)嶄新的智能時(shí)代。AI技術(shù)的進(jìn)步不僅推動(dòng)了各行各業(yè)的數字化轉型,也為通信技術(shù)的未來(lái)發(fā)展奠定了基礎,特別是在邁向6G的過(guò)程中發(fā)揮著(zhù)至關(guān)重要的作用。
在A(yíng)I革命大背景下,2023年6月,國際電信聯(lián)盟(ITU)完成對6G愿景的框架定義工作,從兩個(gè)方面回答了什么是6G[1]。第一,6G將持續演進(jìn)移動(dòng)通信,持續增強移動(dòng)寬帶eMBB、高可靠低延時(shí)通信URLLC,以及海量連接mMTC等三大業(yè)務(wù)場(chǎng)景,提供沉浸式、確定性的通信體驗和支撐海量連接的能力;第二,6G將超越移動(dòng)通信的范疇,實(shí)現通信感知一體化、AI通信一體化,以及空天地泛在的全域連接,讓人們超越人眼“觀(guān)察”物理世界,并在虛擬世界中構建數字孿生。6G的愿景是全球共識的重要成果,是向6G全球統一標準邁進(jìn)的重要里程碑。
在三個(gè)超越通信的場(chǎng)景中,AI通信一體化主要探討的是如何設計6G來(lái)原生地支撐未來(lái)海量的AI服務(wù)和AI應用。未來(lái)的5到10年,99%的開(kāi)發(fā)、設計和文字工作將被AI取代。不久的將來(lái),大模型甚至還將取代架構設計、芯片設計。這個(gè)未來(lái)趨勢,將與6G的部署時(shí)間窗相重疊。4G LTE的技術(shù)創(chuàng )新,把我們帶入移動(dòng)互聯(lián)網(wǎng)時(shí)代,智能手機的App 成為了應用和服務(wù)的主要載體。進(jìn)入人工智能時(shí)代,應用和服務(wù)的核心載體將不再是 App,也不再是網(wǎng)站,而是AI-Agent。
AI-Agent是一個(gè)能感知,并且能主動(dòng)采取行動(dòng)的智能體,能夠根據環(huán)境自行設定行動(dòng)目標,具有感知學(xué)習和獲取知識能力,持續不斷地提升自己的能力。而近年來(lái)大模型的成功,也把 AI-Agent 的能力提升到一個(gè)全新的水平,不僅僅只是生成式AI,而是交互性AI,可以進(jìn)行復雜的交互式對話(huà)和決策。因此,在6G時(shí)代,網(wǎng)絡(luò )的使能對象不僅僅是AI-Agent,而且是人工通用智能AGI(Artificial General Intelligence)。華為最早在2019年提出的“萬(wàn)物智聯(lián)”(Connected Intelligence)的愿景(如圖1),支持原生AI能力,實(shí)際上就是兩個(gè)方面:AGI for 6G 和 6G for AGI [2]。
圖1 : Connected Intelligence = AGI for 6G + 6G for AGI
本文將圍繞AGI for 6G和6G for AGI兩個(gè)方面展開(kāi),尤其側重6G for AGI。如圖2所示,6G for AGI就是要回答如何設計eMBB+、URLLC+、mMTC+等通信能力,以及如何利用網(wǎng)絡(luò )感知能力,共同更好地支撐AI,讓6G成為連接未來(lái)AI智能體的神經(jīng)中樞,成為AI學(xué)習、訓練、推理的重要組成部分。這也要求6G系統的設計必須是一個(gè)超越連接的架構,并進(jìn)一步集成AI-Agent的四大基本功能:感知、認知、決策、行動(dòng),通過(guò)基于意圖的高效能通信,深度融合物理世界和數字世界,并對物理世界產(chǎn)生作用。
圖2 :6G原生AI能力和6G for AGI的整體框架
AGI for 6G
6G時(shí)代AGI的通信基本模式是基于Weaver的效用通信(Effectiveness Communication [3]),也可以簡(jiǎn)稱(chēng)為意圖通信。這是一個(gè)超越香農通信的框架:香農通信只是傳輸比特,然而,比特不代表理解,不具備智能,這是AGI使能的6G通信與傳統通信的本質(zhì)區別。
基于A(yíng)I-Agent的6G通信可以分為四類(lèi):
- 第一,人與人的第一系統和第二系統通信;
- 第二,機器與機器的意圖通信;
- 第三,人與機器的URLLC通信;
- 第四,基于空間計算的機器與人的Metaverse 通信。
為支撐基于A(yíng)I-Agent的6G通信框架,3GPP標準的設計需要考慮支持感知、學(xué)習的上行信道,并且能夠支持推理、支持低延時(shí)、支持Metaverse的下行信道。下面我們著(zhù)重介紹前兩類(lèi)。后兩類(lèi)的通信在利用基于A(yíng)I-Agent的框架上與前兩類(lèi)的使用方法類(lèi)似,但場(chǎng)景不同,具體的通信需求也相應有所不同。
AI-Agent輔助的人與人通信
未來(lái)基于大模型的通信,將是物理世界通信和數字世界通信的有機融合,會(huì )引入AGI后香農通信架構。以人與人的通信舉例,其核心概念包含兩個(gè)部分:
- 第一,每個(gè)人可以用一個(gè)大模型來(lái)代理,這個(gè)大模型就是一個(gè)GPT;
- 第二,每個(gè)人的大模型可以根據GPT,用空間計算,生成多模態(tài)的虛擬實(shí)時(shí)響應,代表人確定性行為的代理響應。在數字世界中,基于此類(lèi)GPT代理之間的通信系統,稱(chēng)為第一系統。而對于如喜怒哀樂(lè )的情感等非確定性行為,大模型無(wú)法準確學(xué)習和建模,此時(shí)針對這部分信息的溝通傳遞,需要在物理世界進(jìn)行實(shí)時(shí)通信,稱(chēng)為第二系統,其亦可基于GPT大模型來(lái)設計。
每個(gè)人可以發(fā)布自己的大模型,在人與人的通信之前,可以先獲取對方的大模型,來(lái)進(jìn)行兩個(gè)大模型之間的第一系統通信,這實(shí)際上是本地通信,不需要用無(wú)線(xiàn)通信資源。當大模型無(wú)法生成第二系統通信的部分時(shí),需要通過(guò)無(wú)線(xiàn)信道進(jìn)行通信。
6G的AGI與AGI通信(如圖3),內信道是香農通信,其外信道通信,是神經(jīng)網(wǎng)絡(luò )與神經(jīng)網(wǎng)絡(luò )的通信,是大模型與大模型的通信,是Agent與Agent的通信。這里需要指出,無(wú)線(xiàn)空口的GPU化,不能帶來(lái)性能提升,反而要付出犧牲功耗的代價(jià)。
圖3 :基于GPT大模型的AGI后香農通信架構
以AI-Agent為輔助的人與人通信是一種先進(jìn)的交互方式,它利用了人工智能的強大能力來(lái)增強和優(yōu)化通信過(guò)程。在這個(gè)框架中,每個(gè)人都會(huì )擁有兩個(gè)主要的GPT大模型:第一系統用于本地智能處理,第二系統用于物理通信。
首先,每個(gè)人要訓練好自己的第一系統AI-Agent使用的GPT大模型,以及用于物理通信第二系統的GPT大模型。這些訓練主要是離線(xiàn)的監督學(xué)習,基于一個(gè)更廣義用于的通用大模型進(jìn)行訓練,可以持續更新,且可以有人的參與輔助(Human in the loop),從而讓所得的GPT模型更精準強大。其次,為了檢測第一系統工作是否正常,需要一個(gè)涌現的檢測器,當發(fā)現有第一系統不能學(xué)習和建模的部分,則分流給第二系統進(jìn)行學(xué)習。
這樣就形成了一個(gè)快速和慢速結合的通信架構:第一系統是快速的,可以由通信雙發(fā)交互各自的AI-Agent來(lái)實(shí)現Agent之間的本地閉環(huán)通信,不需占用通信資源(如圖4);第二系統是慢速的,可以用無(wú)線(xiàn)信道進(jìn)行通信(如圖5)。值得一提的是,通過(guò)基于A(yíng)GI的意圖通信機制,第二系統的通信流量與直接的視頻通信相比,可以壓縮百倍甚至千倍。此外,第一系統和第二系統的AI-Agent均可以不斷對通用大模型進(jìn)行刷新。
圖4 :基于GPT大模型的第一系統-快速本地通信
圖5 :基于GPT大模型的第二系統-慢速物理通信
AI-Agent輔助的機器與機器通信
對于機器與機器的通信,如果直接上傳視覺(jué)傳感的結果(如完整的視頻、點(diǎn)云等信息)去支持在邊/云端用大模型進(jìn)行計算,則需要“極大上行”的流量,能支持的機器數量較為受限。如果在終端有初級的AI-Agent, 通過(guò)無(wú)線(xiàn)信道與云端的大模型計算進(jìn)行Token的實(shí)時(shí)對齊,從而利用端-管-云的AI-Agent協(xié)同,就可以實(shí)現海量機器與機器的通信(如圖6)。
圖6 :6G機器與機器間的意圖通信范式
具體而言,基于A(yíng)I-Agent的后香農通信框架采用意圖通信的方式包括如下步驟:
- 第一步,在終端側引入AI-Agent對場(chǎng)景進(jìn)行初級預處理分析,即所謂的面向目標的篩選(goal-oriented filtering),從而對傳感數據進(jìn)行實(shí)時(shí)清洗;
- 第二步,對提取的相關(guān)對象進(jìn)行transformer大模型中所謂的嵌入計算(Embedding)得到意圖的極簡(jiǎn)數學(xué)描述(Token);
- 第三步,通過(guò)無(wú)線(xiàn)信道傳回邊/云端,實(shí)現雙邊意圖(由Token表示)的實(shí)時(shí)對齊,由此完成端-管-云協(xié)同的高效機器與機器通信。
與直接的視頻傳輸相比,此傳輸機制下的流量可以壓縮百倍甚至千倍,從而量級性提升系統可支持的通信用戶(hù)數量。
6G for AGI
6G感知為AI學(xué)習提供大數據源泉
6G網(wǎng)絡(luò )中應用AI-Agent服務(wù)的獨特優(yōu)勢還在于,6G系統是通感融合的。通信感知一體化為無(wú)線(xiàn)通信系統帶來(lái)了新的機會(huì )——在通信的同時(shí)提供無(wú)線(xiàn)感知服務(wù)。感知和通信的原生融合,使移動(dòng)基站和終端可以在不需要額外使用頻譜及增加設備成本的前提下,通過(guò)協(xié)同感知,獲得更大的感知范圍和更高的感知精度。6G更短的無(wú)線(xiàn)電波長(cháng)、更寬的頻譜資源和更大的天線(xiàn)孔徑將使得物理環(huán)境的高精度實(shí)時(shí)重構成為一種服務(wù),利用這一能力也能反過(guò)來(lái)在顯著(zhù)增強無(wú)線(xiàn)傳輸性能的同時(shí)大幅降低傳輸功耗。
6G感知提取的數據不僅僅只是對整網(wǎng)物理世界的建模,也是AI學(xué)習的大數據源泉(如圖7)。人、機器、車(chē)、建筑、材質(zhì),甚至是天氣,都可作為6G感知的對象。無(wú)線(xiàn)感知可以通過(guò)電波傳播的參數估計、成像,甚至質(zhì)譜檢測來(lái)提供關(guān)于環(huán)境的大數據。從厘米波、毫米波,到亞太赫茲等全通信頻譜的感知能力均值得關(guān)注和研究。在高精度感知領(lǐng)域,太赫茲技術(shù)有望得到廣泛的應用。
圖7: 6G感知是支撐未來(lái)AI大模型的主要數據來(lái)源
6G提供智能普惠的A-RAN和A-CORE
以ChatGPT為代表的自然語(yǔ)言大模型,在不久的將來(lái),就會(huì )達到和超越人類(lèi)的能力。然而,其代價(jià)是需要基于超算集群的算力才能提供“類(lèi)人”的智能。比如,擁有5千億的神經(jīng)網(wǎng)絡(luò )參數,需要千萬(wàn)瓦級的供電才能運行,在未來(lái)的10年,大概率無(wú)法在手機終端上運行。
為了給所有人、所有物提供隨時(shí)隨地的智能服務(wù),6G網(wǎng)絡(luò )必須承擔起智能普惠的責任。這就需要基于6G網(wǎng)絡(luò )采用基于大模型的“通信(C)+ AI(A)+ 感知(S)”架構。而通信-AI-感知的融合,也正是6G的本質(zhì)特征所在。支撐AGI的后香農通信架構,也就是:通信+AI+感知(C+A+S)的移動(dòng)接入網(wǎng),我們稱(chēng)之為A-RAN(如圖8)。
圖8:A-RAN架構:通信-AI-感知融合的接入網(wǎng)絡(luò )
同樣,6G網(wǎng)絡(luò )可以基于 AI-Agent 來(lái)構建,每個(gè)AI-Agent就可以是一個(gè)邏輯網(wǎng)元。早在2015年,華為公司2012實(shí)驗室就提出應用驅動(dòng)的網(wǎng)絡(luò ),其核心思想是,基于客戶(hù)相對應用的需求,自動(dòng)生成定制的網(wǎng)路,應用完畢,網(wǎng)絡(luò )也就撤除;A設施就像全網(wǎng)一部計算平臺,這是一個(gè)基于任務(wù)的網(wǎng)絡(luò )架構,也是6G A-CORE的雛形(如圖9)。
圖9:A-CORE架構:以任務(wù)為中心的網(wǎng)絡(luò )架構
6G AGI構建實(shí)時(shí)孿生世界
在數字世界里,根據應用的“意圖”,通過(guò)構建物理實(shí)體的虛擬副本來(lái)模擬和分析現實(shí)世界的行為和性能,就是我們通常所謂的數字孿生。這里主要對數字孿生的兩項技術(shù)進(jìn)行闡釋。第一,基于意圖通信,構建能夠實(shí)時(shí)反映真實(shí)物理世界的數字孿生體;第二,基于實(shí)時(shí)孿生世界,對物理世界進(jìn)行準確的時(shí)空推理。這兩項技術(shù)具有廣泛的應用潛力,可應用于如自動(dòng)駕駛、機器人、智能工業(yè)生產(chǎn)和遠程醫療等眾多場(chǎng)景。
首先,在一個(gè)小房間的物理空間里,放置有通信和感知一體化的6G終端,這些6G終端具有AI的算力,可以計算小規模的AI模型。同時(shí),它們也可以通過(guò)無(wú)線(xiàn)信號感知物理世界。通過(guò)對感知信號進(jìn)行處理,可以生成點(diǎn)云來(lái)刻畫(huà)和描述物理世界。, P>
之后,根據給定意圖,通過(guò)網(wǎng)絡(luò )中的AI大模型與6G終端的AI小模型之間的AGI通信,有選擇性地重構物理世界。這里的孿生世界并不需要完整無(wú)缺地描述物理世界,而是識別跟意圖相關(guān)的內容。這樣既可以節省通信開(kāi)銷(xiāo),還可以保護隱私,保護個(gè)人和場(chǎng)地的私密性。
感知系統真正感知的是“點(diǎn)云”信息,也就是三維空間中物體的點(diǎn)陣表示。為了減少數據傳輸量和保護用戶(hù)的隱私,我們只會(huì )在語(yǔ)義目標和原始感知信息匹配時(shí),才會(huì )將時(shí)空語(yǔ)義信息上傳到云端進(jìn)行融合。為此,我們開(kāi)發(fā)了獨特的語(yǔ)義時(shí)空融合和預測算法,可以融合語(yǔ)義信息形成數字孿生。這使得數字孿生能夠幾乎實(shí)時(shí)地反映我們關(guān)心的信息,同時(shí)將上行傳輸帶寬需求降低幾個(gè)數量級。
基于實(shí)時(shí)孿生的世界,這里演示一個(gè)用自然語(yǔ)言驅動(dòng)事物定位和人物追蹤的用例。與目前ChatGPT不同,我們的系統能夠實(shí)時(shí)感知現實(shí)世界,并進(jìn)行語(yǔ)義、時(shí)間和空間的推理,最終以自然語(yǔ)言的形式呈現結果。在這個(gè)例子中,物體和人物的移動(dòng)位置都會(huì )以卡通人物渲染的形式實(shí)時(shí)顯示在數字孿生體中。6G AGI系統會(huì )根據感知到的點(diǎn)云信息,判斷是否發(fā)生與預先設定的意圖(如“看書(shū)”)相關(guān)的動(dòng)作,并實(shí)時(shí)定位相關(guān)事件的空間位置。隨著(zhù)感知系統的不斷完善,推理的準確性也將不斷提高。
本文探討了未來(lái)大模型時(shí)代下的6G原生AGI通信,介紹了
- Connected Intelligence = AGI for 6G + 6G for AGI:
- AGI for 6G:后香農通信架構使能的效用通信(Effectiveness Communication);
- 6G for AGI:集AI學(xué)習、訓練、推理為一體的普惠智能神經(jīng)中樞;
- 通信、感知、AI融合的 6G A-RAN;
- 基于A(yíng)gent網(wǎng)元構建以任務(wù)為中心的 6G A-CORE。
我們認為,6G的本質(zhì)是通信-AI-感知的融合,成為服務(wù)萬(wàn)千AI-Agent的神經(jīng)中樞。