摘要:當(dāng)前關(guān)于如何激勵更多邊緣節(jié)點參與邊緣計算環(huán)境仍然缺乏研究,為此本文首先基于斯塔克爾伯格博弈理論提出了在云—邊環(huán)境中單個云服務(wù)下行任務(wù)的激勵機制設(shè)計,考慮了云節(jié)點和邊緣節(jié)點間的博弈以及邊緣節(jié)點內(nèi)部的博弈,該激勵機制能夠適應(yīng)邊緣計算環(huán)境的動態(tài)性。同時提出了“云-邊-端”三層 架構(gòu)環(huán)境中多個云服務(wù)下行任務(wù)的激勵機制;最后,本文提出了一種邊緣節(jié)點相互合作以實現(xiàn)資源分配均衡的合作激勵機制,該合作激勵機制能夠有效激勵邊緣節(jié)點貢獻資源以及均衡任務(wù)間的資源分配。此外,本文給出了關(guān)于該問題可進一步開展的重點研究工作。
關(guān)鍵詞:邊緣計算;激勵機制;斯塔克爾伯格均衡;重疊聯(lián)盟形成博弈
1 背景
邊緣計算是近年來興起的前沿技術(shù),已成為國內(nèi)外工業(yè)界和學(xué)術(shù)界關(guān)注的熱點。其基本設(shè)想是將計算、存儲資源以及服務(wù)等從云端下行到靠近終端用戶的邊緣側(cè),從而減少用戶時延,緩解網(wǎng)絡(luò)數(shù)據(jù)傳輸壓力,創(chuàng)造出一個具備高性能、低延遲、高帶寬的大數(shù)據(jù)處理服務(wù)環(huán)境[1]。與云計算架構(gòu)相比,邊緣計算主要具有兩方面 顯著優(yōu)勢:(1)可在邊緣側(cè)處理大量臨時數(shù)據(jù),緩解遠程數(shù)據(jù)中心和網(wǎng)絡(luò)帶寬的壓力;(2)結(jié)合5G技術(shù)共同向多樣化的終端設(shè)備提供更靠近的本地化服務(wù),顯著增強服務(wù)的響應(yīng)能力。鑒于邊緣計算的優(yōu)勢,學(xué)術(shù)界和工業(yè)界就邊緣計算環(huán)境等諸多問題展開了大量研究,包括服務(wù)放置和請求調(diào)度問題、服務(wù)質(zhì)量(QoS)提升問題、負載均衡問題、邊緣網(wǎng)絡(luò)數(shù)據(jù)存儲問題等。
然而,當(dāng)前邊緣計算的相關(guān)工作大多假設(shè)邊緣節(jié)點自愿為云數(shù)據(jù)中心托管服務(wù),忽視了邊緣節(jié)點的個體理性和自私性。在邊緣計算中,這些邊緣節(jié)點通常是由不同基礎(chǔ)設(shè)施提供商(如Amazon的AWS、阿里云等)提供的邊緣服務(wù)器,具有一定計算能力和存儲能力。單個邊緣節(jié)點資源能力有限,難以承擔(dān)云服務(wù)下行任務(wù)帶來的大量的終端用戶需求,因此需要由多個邊緣節(jié)點共同承擔(dān)下行任務(wù)。對邊緣節(jié)點而言,為云數(shù)據(jù)中心托管服務(wù)會消耗其自身資源,包括計算資源、存儲資源和傳輸資源,從而造成資源開銷。通常,邊緣節(jié)點提供者是個體理性的,如果參與邊緣計算帶來的凈收益(即所獲報酬減去所需開銷)為負,則不會參與;邊緣節(jié)點提供者是自私的,其目的都是最大化自己的凈收益,不會為了整體或其他節(jié)點的利益而損害自己的利益。也就是說,邊緣節(jié)點不會自愿無私地貢獻自己的資源來托管下行的云端服務(wù)。因此,亟待解決激勵邊緣節(jié)點為云端服務(wù)提供空閑資源的問題,從而構(gòu)建持續(xù)可擴展的邊緣層共享資源池。
構(gòu)建一個有足夠邊緣節(jié)點愿意貢獻部分資源,為更多下行云服務(wù)提供服務(wù)的邊緣計算環(huán)境,建立對應(yīng)的高效激勵機制,是一個非常具有挑戰(zhàn)的問題。由于邊緣節(jié)點的個體理性和自私性,邊緣計算環(huán)境中所有實體“各自為政”,只考慮自身利益,因而我們無法通過傳統(tǒng)的優(yōu)化建模方式來解決上述問題。盡管在一些領(lǐng)域(如群智感知、對等網(wǎng)絡(luò)等)已有關(guān)于激勵機制設(shè)計的工作, 但邊緣計算環(huán)境仍缺少高效的激勵機制設(shè)計研究。和其他領(lǐng)域的問題不同,邊緣計算環(huán)境是云-邊-端三層架構(gòu),即云端層、邊緣層和終端用戶層,其中各個邊緣節(jié)點的能力不一,這種多層次異構(gòu)結(jié)構(gòu)加大了激勵機制設(shè)計求解的復(fù)雜度。
2 相關(guān)工作
在邊緣計算領(lǐng)域,一些經(jīng)濟學(xué)理論已被應(yīng)用于激勵機制設(shè)計,包括斯塔克爾伯格博弈、市場模型和契約理論等。Zhou等人面向邊緣計算下的移動群體感知問題,提出一個魯棒群體移動感知框架RMCS[2]。Shen等 人研究了霧計算環(huán)境下的移動眾包感知[3],設(shè)計了一個 基于斯塔克伯格博弈的激勵機制來激勵霧計算中的邊緣節(jié)點將其感知信息傳回控制器。Zheng等人以云端效用最大化為目標設(shè)計了一種基于斯塔克伯格博弈的邊緣緩存激勵機制[4]。Zeng等人針對霧計算環(huán)境中的計算負載均衡問題設(shè)計了一種基于契約的激勵機制[5]。Yang Liu 等人設(shè)計了一種基于斯塔爾伯格博弈的激勵機制,并提出多輪搜索最優(yōu)解的算法來實現(xiàn)邊緣計算環(huán)境中的計算負載均衡[6]。然而,目前邊緣計算環(huán)境中的激勵機制設(shè) 計仍然缺乏深入研究。盡管已有研究利用斯塔爾伯格博弈來設(shè)計邊緣計算負載均衡的激勵機制,但是這些工作只考慮了云節(jié)點和邊緣節(jié)點之間的協(xié)商,而忽略了不同邊緣節(jié)點之間的博弈,同時無法給出帶約束的兩階段斯塔爾伯格對策的最優(yōu)解析解。如何在考慮兩類競爭的同時激勵邊緣節(jié)點參與云服務(wù)下行任務(wù)有待進一步研究。此外,目前也沒有相關(guān)工作考慮在邊緣計算環(huán)境下用合作博弈的方式來設(shè)計激勵機制,也沒有工作關(guān)注激勵機制多任務(wù)間資源分配不均衡的問題。
3 主要研究問題
在邊緣計算環(huán)境中,面對不同基礎(chǔ)設(shè)施提供商提供的邊緣服務(wù)器自私理性、“各自為政”的情況,我們研究通過設(shè)計激勵機制來激勵邊緣服務(wù)器為云端服務(wù)提供空閑資源,提高邊緣層基礎(chǔ)設(shè)施的服務(wù)能力,構(gòu)建持續(xù)可擴展的邊緣層共享資源池,搭建共享和共贏的邊緣計算服務(wù)平臺,在緩解云數(shù)據(jù)中心壓力和網(wǎng)絡(luò)帶寬壓力的同時為更多終端客戶提供質(zhì)量更高的內(nèi)容服務(wù)。具體的研究問題如下:
(1)如何設(shè)計云-邊環(huán)境單個云服務(wù)下行任務(wù)的激勵機制?如圖1所示,邊緣計算網(wǎng)絡(luò)通常由云節(jié)點、邊緣節(jié)點和終端用戶組成,云節(jié)點希望將云服務(wù)下行到靠近用戶的邊緣節(jié)點上,從而提高用戶服務(wù)質(zhì)量,緩解網(wǎng)絡(luò)帶寬壓力。然而,為下行云服務(wù)提供資源會讓邊緣節(jié)點自身產(chǎn)生開銷。這些邊緣節(jié)點由不同的邊緣設(shè)施提供商操作,是理性和獨立的節(jié)點。如果沒有足夠的激勵, 邊緣節(jié)點將不會自愿承擔(dān)下行云服務(wù)。本文重點關(guān)注云-邊環(huán)境中單個云服務(wù)下行任務(wù),研究如何設(shè)計邊緣 計算激勵機制來高效地激勵異構(gòu)的邊緣節(jié)點貢獻空余資源,承擔(dān)下行云服務(wù)。同時,考慮到各節(jié)點的自私理性,研究如何在每個節(jié)點都希望最大化自身利益的同時能夠保證云服務(wù)下行任務(wù)的質(zhì)量。
圖1 邊緣計算網(wǎng)絡(luò)框架
(2)如何在云-邊-端環(huán)境中建立多任務(wù)激勵機制?在云-邊環(huán)境激勵機制設(shè)計的基礎(chǔ)上,我們考慮云- 邊-端環(huán)境的激勵機制設(shè)計。和其他領(lǐng)域不同,邊緣計 算激勵機制涉及到云端、邊緣層、終端用戶三層,包括云服務(wù)下行和終端用戶請求上行兩部分。邊緣節(jié)點不僅要考慮為云端提供資源,還需要考慮為其附近的終端用戶提供資源。因此,邊緣節(jié)點需要同時考慮云端和終端用戶,確定具體的資源提供量,來實現(xiàn)自身利益最大化的目的。同時,我們研究多個云服務(wù)下行任務(wù),每個邊緣節(jié)點可以同時參加多個任務(wù)。相比單任務(wù)激勵機制, 多任務(wù)激勵機制能夠幫助云節(jié)點和邊緣節(jié)點作出更有利于自身的決策。所以,在設(shè)計激勵機制時還需要考慮邊緣節(jié)點如何選擇任務(wù)以及如何為各個任務(wù)確定提供的資源量。
(3)如何設(shè)計資源分配均衡的激勵機制?在多任務(wù)激勵機制問題中,各邊緣節(jié)點為了最大化自身利益, 會傾向于向回報率高的任務(wù)提供資源,最終導(dǎo)致回報率高的任務(wù)收到過多資源而造成資源浪費,回報率低的任務(wù)不能收到足夠的資源而造成任務(wù)無法保質(zhì)完成。本文研究如何設(shè)計激勵機制來有效解決這種任務(wù)間資源分配不均衡的問題,從而提高資源利用率,提升云服務(wù)下行任務(wù)的總體性能。
4 主要研究工作
為了解決上述問題,有效激勵邊緣節(jié)點提供空閑資源,提升邊緣層基礎(chǔ)設(shè)施的服務(wù)能力,我們主要開展了以下幾個方面研究工作:
(1)基于斯塔克爾伯格博弈建立云-邊環(huán)境單個云服務(wù)下行任務(wù)的激勵機制。我們基于斯塔克伯格博弈理論設(shè)計了一種有效的單任務(wù)激勵機制,以激勵更多的邊緣節(jié)點為云端托管下行的云服務(wù)。圖2展現(xiàn)了邊緣計算單任務(wù)激勵機制的工作流程。首先,云節(jié)點釋放一個云服務(wù)下行任務(wù)。邊緣節(jié)點如果愿意執(zhí)行此任務(wù),它將消耗其原本用于部署本地服務(wù)的資源。因此,它會期望從相應(yīng)的云節(jié)點獲得報酬來彌補產(chǎn)生的資源開銷。之后, 每個邊緣節(jié)點根據(jù)成本和報酬制定服務(wù)提供計劃,并將其提交到云節(jié)點。云節(jié)點從邊緣節(jié)點收集提供服務(wù)的計劃,選擇一部分邊緣節(jié)點來參與任務(wù)。在選定的邊緣節(jié)點提供資源后,云節(jié)點計算并發(fā)送每個選定邊緣節(jié)點的報酬。在整個云服務(wù)下行任務(wù)過程中,云節(jié)點旨在最大化自己的效用。邊緣節(jié)點由不同的邊緣提供商操作,希望最大化自身效用,并在足夠的激勵下實現(xiàn)云服務(wù)下行任務(wù)。我們將該激勵流程建模為斯塔克爾伯格博弈模型,同時考慮了云節(jié)點和邊緣節(jié)點間的博弈,以及邊緣節(jié)點內(nèi)部的博弈。然后,研究了該復(fù)雜博弈模型最優(yōu)解的求解方法,給出斯塔克爾伯格均衡的解析解及其嚴格推導(dǎo)過程,并討論其唯一性。該云-邊環(huán)境單任務(wù)激勵 機制可以有效地激勵云節(jié)點和邊緣節(jié)點參與邊緣環(huán)境, 且適用于動態(tài)邊緣環(huán)境。
圖2 邊緣計算單任務(wù)激勵機制工作流程
(2)將云服務(wù)下行任務(wù)建模為重疊聯(lián)盟,設(shè)計云-邊-端環(huán)境中的多任務(wù)激勵機制。在云-邊環(huán)境激勵機制的基礎(chǔ)上,我們提出了云-邊-端環(huán)境的激勵機制。 如圖3所示,邊緣計算云服務(wù)下行系統(tǒng)分為云服務(wù)下行和終端用戶請求上行兩個部分。在云服務(wù)下行過程中, 云平臺將同時發(fā)布多個云服務(wù)下行任務(wù),并招募邊緣節(jié)點來緩存服務(wù),從而確保延遲敏感型服務(wù)的網(wǎng)絡(luò)服務(wù)質(zhì)量。考慮到邊緣節(jié)點的自私性和個體理性,云平臺將提供相應(yīng)報酬給貢獻資源的邊緣節(jié)點。在終端用戶請求上行過程中,每個邊緣節(jié)點需要處理原本就由其承擔(dān)的附近終端用戶發(fā)送的請求。這些終端用戶在請求完成后, 將為相應(yīng)的邊緣節(jié)點支付任務(wù)獎勵。我們將每個任務(wù)建模為重疊的聯(lián)盟,在重疊聯(lián)盟中理性的局中人可以同時加入多個聯(lián)盟。也就是說,每個邊緣節(jié)點可以同時參加多個任務(wù),根據(jù)所有任務(wù)的情況來挑選任務(wù)并制定為任務(wù)提供資源的方案。
圖3 云-邊-端架構(gòu)多任務(wù)激勵機制設(shè)計
(3)提出合作激勵機制設(shè)計,有效保證任務(wù)間資源分配均衡。基于重疊聯(lián)盟形成博弈,本文設(shè)計了一種合作激勵機制,以鼓勵邊緣節(jié)點從云平臺選擇多個下行云服務(wù)時相互協(xié)作。在多任務(wù)激勵機制問題中,各邊緣節(jié)點為了最大化自身利益,會傾向于向回報率高的任務(wù)提供資源。合作激勵機制能夠防止這種情況的發(fā)生,從而避免了該任務(wù)收集的資源浪費和任務(wù)間資源分配不均衡的情況,也避免了邊緣節(jié)點都加入單一任務(wù)而各自得到的報酬過低的情況。相比非合作方法,該合作激勵機制獲得了更高的云節(jié)點效用,并且任務(wù)間的資源分配更加均衡。
5 發(fā)展展望
當(dāng)前我們考慮到邊緣服務(wù)器自私理性的特點,研究了邊緣計算環(huán)境下激勵機制設(shè)計,著力解決邊緣層基礎(chǔ)設(shè)施服務(wù)能力不足的問題,為更多終端客戶提供質(zhì)量更高的內(nèi)容服務(wù),后續(xù)我們將繼續(xù)在該領(lǐng)域開展相關(guān)的研究工作:
(1)結(jié)合邊緣設(shè)備層的激勵機制設(shè)計研究。當(dāng)前邊緣計算環(huán)境的激勵機制研究主要考慮了如何激勵邊緣服務(wù)器構(gòu)成的邊緣層。在更靠近終端用戶處,還有由終端用戶手機、路由、個人電腦等邊緣設(shè)備構(gòu)成的邊緣設(shè)備層,這些邊緣設(shè)備通常會連接到邊緣服務(wù)器,再通過邊緣服務(wù)器連接到云端,可以作為邊緣服務(wù)器的擴展。下一步工作將關(guān)注包含邊緣服務(wù)器和邊緣設(shè)備的雙層邊緣層,在已有的基礎(chǔ)上進一步研究如何激勵邊緣設(shè)備為邊緣服務(wù)器提供額外支撐,從而構(gòu)建更具擴展性的邊緣計算共享資源池。
(2)考慮邊緣節(jié)點資源位置分布的邊緣計算激勵機制設(shè)計研究。當(dāng)前的激勵機制設(shè)計大多是以激勵邊緣節(jié)點貢獻空閑資源為研究目標,而沒有考慮到邊緣計算模式的最終目的是提高終端用戶服務(wù)質(zhì)量(QoS),提升終端用戶服務(wù)體驗。相比云數(shù)據(jù)中心,邊緣節(jié)點計算存儲能力有限,但是數(shù)量更多且分散地分布在靠近用戶的地方,邊緣節(jié)點可提供資源的位置分布也將成為影響服務(wù)質(zhì)量的重要因素。相比附近用戶對下行云服務(wù)需求低的邊緣節(jié)點,對應(yīng)需求高的邊緣節(jié)點需要提供更多資源才能有效提升其附近終端用戶的服務(wù)質(zhì)量。因此,在后續(xù)研究中,將在考慮資源位置分布的基礎(chǔ)上設(shè)計激勵機制,從而能夠更有效地保證用戶的服務(wù)質(zhì)量。
(3)激勵機制安全保障體系研究。在邊緣環(huán)境激勵機制中,云端和邊緣節(jié)點的行為難以得到保證,雙方可能存在作弊的情況,使得激勵機制的合理性和有效性受到質(zhì)疑。因此,需要研究如何構(gòu)建安全可靠的誠信評價系統(tǒng),設(shè)計懲罰函數(shù)來抑制非理性不公平的競爭,確保激勵機制運行時云端和邊緣節(jié)點不會出現(xiàn)作弊行為。同時,可以考慮如何結(jié)合區(qū)塊鏈,引進智能協(xié)議等技術(shù),確保云節(jié)點和邊緣節(jié)點遵循激勵機制給出的最優(yōu)策略,實現(xiàn)去第三方的激勵機制安全保障體系。
作者簡介:
姚晨蝶,國防科技大學(xué)系統(tǒng)工程學(xué)院研究生,主要研究方向為邊緣計算、智能博弈等。
謝俊杰,軍事科學(xué)院系統(tǒng)工程研究院工程師,主要研究方向為分布式系統(tǒng)、軟件定義網(wǎng)絡(luò)、移動邊緣計算等。
郭得科,國防科技大學(xué)系統(tǒng)工程學(xué)院教授,主要研究方向為網(wǎng)絡(luò)計算與系統(tǒng)、分布式計算與系統(tǒng)、網(wǎng)絡(luò)空間安全、移動計算等。榮獲湖南省自然科學(xué)一等獎(排名第一)、2020年度CCF-IEEE CS青年科學(xué)家獎、IEEE ICNP 2019最佳論文;以第一完成人出版學(xué)術(shù)專著2 部,獲得中國和美國授權(quán)發(fā)明專利38項。入選國家優(yōu)青、國家萬人計劃青年拔尖、軍隊高層次科技創(chuàng)新人才工程、湖南省杰青、教育部新世紀人才計劃。
劉 忠,國防科技大學(xué)系統(tǒng)工程學(xué)院副院長、教授,主要研究方向為人工智能、深度強化學(xué)習(xí)、多智能體系統(tǒng)等。擔(dān)任教育部科技創(chuàng)新團隊負責(zé)人、國家人工智能戰(zhàn)略咨詢委員會委員。
參考文獻:
[1] P. Mach and Z. Becvar, et al. Mobile edge computing: A Survey on Architecture and
Computation Offloading[J]. IEEE Communications Surveys and Tutorials, vol. 19,
No. 3, 2017, 1628 – 1656.
[2] Zhou Z, Liao H, Gu B, et al. Robust Mobile Crowd Sensing: When Deep Learning Meets
Edge Computing[J]. IEEE Network, 2018, 32 (4) : 54 - 60.
[3] Shen F, Zhang G, Zhang C, et al. An Incentive Framework for Resource Sensing in Fog
Computing Networks[C]. Global communications conference, 2018: 1 - 6.
[4] Zheng Z, Song L, Han Z, et al. A Stackelberg Game Approach to Proactive Caching in
Large-Scale Mobile Edge Networks[J]. IEEE Transactions on Wireless Communications, 2018, 17 (8) : 5198 - 5211.
[5] Zeng M, Li Y, Zhang K, et al. Incentive Mechanism Design for Computation Offloading in
Heterogeneous Fog Computing: A Contract-based Approach[C]. International Conference on Communications, 2018 : 1 - 6.
[6] Liu Y, Xu C, Zhan Y, et al. Incentive Mechanism for Computation Offloading Using Edge
Computing: A Stackelberg Game Approach[J]. Computer Networks, 2017, 129 (24) : 399 - 409.
摘自《自動化博覽》2021年2月刊