新四季網

微服務rpc調用過程(離不開的微服務架構)

2023-09-13 07:01:59

服務化有什麼好處?

服務化的一個好處就是,不限定服務的提供方使用什麼技術選型,能夠實現大公司跨團隊的技術解耦,如下圖所示:

服務A:歐洲團隊維護,技術背景是Java服務B:美洲團隊維護,用C 實現服務C:中國團隊維護,技術棧是go

服務的上遊調用方,按照接口、協議即可完成對遠端服務的調用。

但實際上,大部分網際網路公司,研發團隊規模有限,大都使用同一套技術體系來實現服務:

這樣的話,如果沒有統一的服務框架,各個團隊的服務提供方就需要各自實現一套序列化、反序列化、網絡框架、連接池、收發線程、超時處理、狀態機等「業務之外」的重複技術勞動,造成整體的低效。

因此,統一服務框架把上述「業務之外」的工作統一實現,是服務化首要解決的問題。

什麼是RPC?

Remote Procedure Call Protocol,遠程過程調用。

什麼是「遠程」,為什麼「遠」?

先來看下什麼是「近」,即「本地函數調用」。

當我們寫下:

int result = Add(1, 2);

這行代碼的時候,到底發生了什麼?

傳遞兩個入參調用了本地代碼段中的函數,執行運算邏輯返回一個出參

這三個動作,都發生在同一個進程空間裡,這是本地函數調用

那有沒有辦法,調用一個跨進程的函數呢?

典型的,這個進程部署在另一臺伺服器上。

最容易想到的,兩個進程約定一個協議格式,使用Socket通信,來傳輸:

入參調用哪個函數出參

如果能夠實現,那這就是「遠程」過程調用。

Socket通信只能傳遞連續的字節流,如何將入參、函數都放到連續的字節流裡呢?

假設,設計一個11位元組的請求報文:

前3個字節填入函數名「add」中間4個字節填入第一個參數「1」末尾4個字節填入第二個參數「2」

同理,可以設計一個4位元組響應報文:

4個字節填入處理結果「3」

調用方的代碼可能變為:

request = MakePacket(「add」, 1, 2);SendRequest_ToService_B(request);response = RecieveRespnse_FromService_B;int result = unMakePacket(respnse);

這4個步驟是:

(1)將傳入參數變為字節流;

(2)將字節流發給服務B;

(3)從服務B接受返回字節流;

(4)將返回字節流變為傳出參數;

服務方的代碼可能變為:

request = RecieveRequest;args/function = unMakePacket(request);result = Add(1, 2);response = MakePacket(result);SendResponse(response);

這個5個步驟也很好理解:

(1)服務端收到字節流;

(2)將字節流轉為函數名與參數;

(3)本地調用函數得到結果;

(4)將結果轉變為字節流;

(5)將字節流發送給調用方;

這個過程用一張圖描述如下:

調用方與服務方的處理步驟都是非常清晰。

這個過程存在最大的問題是什麼呢?

調用方太麻煩了,每次都要關注很多底層細節:

入參到字節流的轉化,即序列化應用層協議細節socket發送,即網絡傳輸協議細節socket接收字節流到出參的轉化,即反序列化應用層協議細節

能不能調用層不關注這個細節?

可以,RPC框架就是解決這個問題的,它能夠讓調用方「像調用本地函數一樣調用遠端的函數(服務)」。

講到這裡,是不是對RPC,對序列化範序列化有點感覺了?往下看,有更多的底層細節。

RPC框架的職責是什麼?

RPC框架,要向調用方屏蔽各種複雜性,要向服務提供方也屏蔽各類複雜性:

服務調用方client感覺就像調用本地函數一樣,來調用服務服務提供方server感覺就像實現一個本地函數一樣,來實現服務

所以整個RPC框架又分為client部分server部分,實現上面的目標,把複雜性屏蔽,就是RPC框架的職責。

如上圖所示,業務方的職責是:

調用方A,傳入參數,執行調用,拿到結果服務方B,收到參數,執行邏輯,返回結果

RPC框架的職責是,中間大藍框的部分:

client端:序列化、反序列化、連接池管理、負載均衡、故障轉移、隊列管理,超時管理、異步管理等等server端:服務端組件、服務端收發包隊列、io線程、工作線程、序列化反序列化等

server端的技術大家了解的比較多,接下來重點講講client端的技術細節。

先來看看RPC-client部分的「序列化反序列化」部分。

為什麼要進行序列化?

工程師通常使用「對象」來進行數據的操縱:

class User{ std::String user_name; uint64_t user_id; uint32_t user_age;}; User u = new User(「shenjian」);u.setUid(123);u.setAge(35);

但當需要對數據進行存儲或者傳輸時,「對象」就不這麼好用了,往往需要把數據轉化成連續空間的「二進位字節流」,一些典型的場景是:

資料庫索引的磁碟存儲:資料庫的索引在內存裡是b 樹,但這個格式是不能夠直接存儲到磁碟上的,所以需要把b 樹轉化為連續空間的二進位字節流,才能存儲到磁碟上緩存的KV存儲:redis/memcache是KV類型的緩存,緩存存儲的value必須是連續空間的二進位字節流,而不能夠是User對象數據的網絡傳輸:socket發送的數據必須是連續空間的二進位字節流,也不能是對象

所謂序列化(Serialization),就是將「對象」形態的數據轉化為「連續空間二進位字節流」形態數據的過程。這個過程的逆過程叫做反序列化

怎麼進行序列化?

這是一個非常細節的問題,要是讓你來把「對象」轉化為字節流,你會怎麼做?很容易想到的一個方法是xml(或者json)這類具有自描述特性的標記性語言:

規定好轉換規則,發送方很容易把User類的一個對象序列化為xml,服務方收到xml二進位流之後,也很容易將其範序列化為User對象。

畫外音:語言支持反射時,這個工作很容易。

第二個方法是自己實現二進位協議來進行序列化,還是以上面的User對象為例,可以設計一個這樣的通用協議:

頭4個字節表示序號序號後面的4個字節表示key的長度m接下來的m個字節表示key的值接下來的4個字節表示value的長度n接下來的n個字節表示value的值像xml一樣遞歸下去,直到描述完整個對象

上面的User對象,用這個協議描述出來可能是這樣的:

第一行:序號4個字節(設0表示類名),類名長度4個字節(長度為4),接下來4個字節是類名(」User」),共12位元組第二行:序號4個字節(1表示第一個屬性),屬性長度4個字節(長度為9),接下來9個字節是屬性名(」user_name」),屬性值長度4個字節(長度為8),屬性值8個字節(值為」shenjian」),共29位元組第三行:序號4個字節(2表示第二個屬性),屬性長度4個字節(長度為7),接下來7個字節是屬性名(」user_id」),屬性值長度4個字節(長度為8),屬性值8個字節(值為123),共27位元組第四行:序號4個字節(3表示第三個屬性),屬性長度4個字節(長度為8),接下來8個字節是屬性名(」user_name」),屬性值長度4個字節(長度為4),屬性值4個字節(值為35),共24位元組

整個二進位字節流共12 29 27 24=92位元組。

實際的序列化協議要考慮的細節遠比這個多,例如:強類型的語言不僅要還原屬性名,屬性值,還要還原屬性類型;複雜的對象不僅要考慮普通類型,還要考慮對象嵌套類型等。無論如何,序列化的思路都是類似的。

序列化協議要考慮什麼因素?

不管使用成熟協議xml/json,還是自定義二進位協議來序列化對象,序列化協議設計時都需要考慮以下這些因素。

解析效率:這個應該是序列化協議應該首要考慮的因素,像xml/json解析起來比較耗時,需要解析doom樹,二進位自定義協議解析起來效率就很高壓縮率,傳輸有效性:同樣一個對象,xml/json傳輸起來有大量的xml標籤,信息有效性低,二進位自定義協議佔用的空間相對來說就小多了擴展性與兼容性:是否能夠方便的增加欄位,增加欄位後舊版客戶端是否需要強制升級,都是需要考慮的問題,xml/json和上面的二進位協議都能夠方便的擴展可讀性與可調試性:這個很好理解,xml/json的可讀性就比二進位協議好很多跨語言:上面的兩個協議都是跨語言的,有些序列化協議是與開發語言緊密相關的,例如dubbo的序列化協議就只能支持Java的RPC調用通用性:xml/json非常通用,都有很好的第三方解析庫,各個語言解析起來都十分方便,上面自定義的二進位協議雖然能夠跨語言,但每個語言都要寫一個簡易的協議客戶端

有哪些常見的序列化方式?

xml/json:解析效率,壓縮率都較差,擴展性、可讀性、通用性較好thriftprotobuf:Google出品,必屬精品,各方面都不錯,強烈推薦,屬於二進位協議,可讀性差了點,但也有類似的to-string協議幫助調試問題AvroCORBAmc_pack:懂的同學就懂,不懂的就不懂了,09年用過,傳說各方面都超越protobuf,懂行的同學可以說一下現狀…

RPC-client除了:

序列化反序列化的部分(上圖中的1、4)

還包含:

發送字節流與接收字節流的部分(上圖中的2、3)

這一部分,又分為同步調用與異步調用兩種方式,下面一一來進行介紹。

畫外音:搞通透RPC-client確實不容易。

同步調用的代碼片段為:

Result = Add(Obj1, Obj2);// 得到Result之前處於阻塞狀態

異步調用的代碼片段為:

Add(Obj1, Obj2, callback);// 調用後直接返回,不等結果

處理結果通過回調為:

callback(Result){// 得到處理結果後會調用這個回調函數 …}

這兩類調用,在RPC-client裡,實現方式完全不一樣。

RPC-client同步調用架構如何?

所謂同步調用,在得到結果之前,一直處於阻塞狀態,會一直佔用一個工作線程,上圖簡單的說明了一下組件、交互、流程步驟:

左邊大框,代表了調用方的一個工作線程左邊粉色中框,代表了RPC-client組件右邊橙色框,代表了RPC-server藍色兩個小框,代表了同步RPC-client兩個核心組件,序列化組件與連接池組件白色的流程小框,以及箭頭序號1-10,代表整個工作線程的串行執行步驟:

1)業務代碼發起RPC調用:

Result=Add(Obj1,Obj2)

2)序列化組件,將對象調用序列化成二進位字節流,可理解為一個待發送的包packet1;

3)通過連接池組件拿到一個可用的連接connection;

4)通過連接connection將包packet1發送給RPC-server;

5)發送包在網絡傳輸,發給RPC-server;

6)響應包在網絡傳輸,發回給RPC-client;

7)通過連接connection從RPC-server收取響應包packet2;

8)通過連接池組件,將conneciont放回連接池;

9)序列化組件,將packet2範序列化為Result對象返回給調用方;

10)業務代碼獲取Result結果,工作線程繼續往下走;

畫外音:請對照架構圖中的1-10步驟閱讀。

連接池組件有什麼作用?

RPC框架鎖支持的負載均衡、故障轉移、發送超時等特性,都是通過連接池組件去實現的。

典型連接池組件對外提供的接口為:

int ConnectionPool::init(…);Connection ConnectionPool::getConnection;int ConnectionPool::putConnection(Connection t);

init做了些什麼?

和下遊RPC-server(一般是一個集群),建立N個tcp長連接,即所謂的連接「池」。

getConnection做了些什麼?

從連接「池」中拿一個連接,加鎖(置一個標誌位),返回給調用方。

putConnection做了些什麼?

將一個分配出去的連接放回連接「池」中,解鎖(也是置一個標誌位)。

如何實現負載均衡?

連接池中建立了與一個RPC-server集群的連接,連接池在返回連接的時候,需要具備隨機性。

如何實現故障轉移?

連接池中建立了與一個RPC-server集群的連接,當連接池發現某一個機器的連接異常後,需要將這個機器的連接排除掉,返回正常的連接,在機器恢復後,再將連接加回來。

如何實現發送超時?

因為是同步阻塞調用,拿到一個連接後,使用帶超時的send/recv即可實現帶超時的發送和接收。

總的來說,同步的RPC-client的實現是相對比較容易的,序列化組件、連接池組件配合多工作線程數,就能夠實現。

遺留問題,工作線程數設置為多少最合適?

這個問題在《工作線程數究竟要設置為多少最合適?》中討論過,此處不再深究。

RPC-client異步回調架構如何?

所謂異步回調,在得到結果之前,不會處於阻塞狀態,理論上任何時間都沒有任何線程處於阻塞狀態,因此異步回調的模型,理論上只需要很少的工作線程與服務連接就能夠達到很高的吞吐量,如上圖所示:

左邊的框框,是少量工作線程(少數幾個就行了)進行調用與回調中間粉色的框框,代表了RPC-client組件右邊橙色框,代表了RPC-server藍色六個小框,代表了異步RPC-client六個核心組件:上下文管理器,超時管理器,序列化組件,下遊收發隊列,下遊收發線程,連接池組件白色的流程小框,以及箭頭序號1-17,代表整個工作線程的串行執行步驟:

1)業務代碼發起異步RPC調用;

Add(Obj1,Obj2, callback)

2)上下文管理器,將請求,回調,上下文存儲起來;

3)序列化組件,將對象調用序列化成二進位字節流,可理解為一個待發送的包packet1;

4)下遊收發隊列,將報文放入「待發送隊列」,此時調用返回,不會阻塞工作線程;

5)下遊收發線程,將報文從「待發送隊列」中取出,通過連接池組件拿到一個可用的連接connection;

6)通過連接connection將包packet1發送給RPC-server;

7)發送包在網絡傳輸,發給RPC-server;

8)響應包在網絡傳輸,發回給RPC-client;

9)通過連接connection從RPC-server收取響應包packet2;

10)下遊收發線程,將報文放入「已接受隊列」,通過連接池組件,將conneciont放回連接池;

11)下遊收發隊列裡,報文被取出,此時回調將要開始,不會阻塞工作線程;

12)序列化組件,將packet2範序列化為Result對象;

13)上下文管理器,將結果,回調,上下文取出;

14)通過callback回調業務代碼,返回Result結果,工作線程繼續往下走;

如果請求長時間不返回,處理流程是:

15)上下文管理器,請求長時間沒有返回;

16)超時管理器拿到超時的上下文;

17)通過timeout_cb回調業務代碼,工作線程繼續往下走;

畫外音:請配合架構圖仔細看幾遍這個流程。

序列化組件和連接池組件上文已經介紹過,收發隊列與收發線程比較容易理解。下面重點介紹上下文管理器超時管理器這兩個總的組件。

為什麼需要上下文管理器?

由於請求包的發送,響應包的回調都是異步的,甚至不在同一個工作線程中完成,需要一個組件來記錄一個請求的上下文,把請求-響應-回調等一些信息匹配起來。

如何將請求-響應-回調這些信息匹配起來?

這是一個很有意思的問題,通過一條連接往下遊服務發送了a,b,c三個請求包,異步的收到了x,y,z三個響應包:

怎麼知道哪個請求包與哪個響應包對應?

怎麼知道哪個響應包與哪個回調函數對應?

可以通過「請求id」來實現請求-響應-回調的串聯。

整個處理流程如上,通過請求id,上下文管理器來對應請求-響應-callback之間的映射關係:

1)生成請求id;

2)生成請求上下文context,上下文中包含發送時間time,回調函數callback等信息;

3)上下文管理器記錄req-id與上下文context的映射關係;

4)將req-id打在請求包裡發給RPC-server;

5)RPC-server將req-id打在響應包裡返回;

6)由響應包中的req-id,通過上下文管理器找到原來的上下文context;

7)從上下文context中拿到回調函數callback;

8)callback將Result帶回,推動業務的進一步執行;

如何實現負載均衡,故障轉移?

與同步的連接池思路類似,不同之處在於:

同步連接池使用阻塞方式收發,需要與一個服務的一個ip建立多條連接異步收發,一個服務的一個ip只需要建立少量的連接(例如,一條tcp連接)

如何實現超時發送與接收?

超時收發,與同步阻塞收發的實現就不一樣了:

同步阻塞超時,可以直接使用帶超時的send/recv來實現異步非阻塞的nio的網絡報文收發,由於連接不會一直等待回包,超時是由超時管理器實現的

超時管理器如何實現超時管理?

超時管理器,用於實現請求回包超時回調處理。

每一個請求發送給下遊RPC-server,會在上下文管理器中保存req-id與上下文的信息,上下文中保存了請求很多相關信息,例如req-id,回包回調,超時回調,發送時間等。

超時管理器啟動timer對上下文管理器中的context進行掃描,看上下文中請求發送時間是否過長,如果過長,就不再等待回包,直接超時回調,推動業務流程繼續往下走,並將上下文刪除掉。

如果超時回調執行後,正常的回包又到達,通過req-id在上下文管理器裡找不到上下文,就直接將請求丟棄。

畫外音:因為已經超時處理了,無法恢復上下文。

無論如何,異步回調和同步回調相比,除了序列化組件和連接池組件,會多出上下文管理器,超時管理器,下遊收發隊列,下遊收發線程等組件,並且對調用方的調用習慣有影響。

畫外音:編程習慣,由同步變為了回調。

異步回調能提高系統整體的吞吐量,具體使用哪種方式實現RPC-client,可以結合業務場景來選取。

總結

什麼是RPC調用?

像調用本地函數一樣,調用一個遠端服務。

為什麼需要RPC框架?

RPC框架用於屏蔽RPC調用過程中的序列化,網絡傳輸等技術細節。讓調用方只專注於調用,服務方只專注於實現調用。

什麼是序列化?為什麼需要序列化?

把對象轉化為連續二進位流的過程,叫做序列化。磁碟存儲,緩存存儲,網絡傳輸只能操作於二進位流,所以必須序列化。

同步RPC-client的核心組件是什麼?

同步RPC-client的核心組件是序列化組件、連接池組件。它通過連接池來實現負載均衡與故障轉移,通過阻塞的收發來實現超時處理。

異步RPC-client的核心組件是什麼?

異步RPC-client的核心組件是序列化組件、連接池組件、收發隊列、收發線程、上下文管理器、超時管理器。它通過「請求id」來關聯請求包-響應包-回調函數,用上下文管理器來管理上下文,用超時管理器中的timer觸發超時回調,推進業務流程的超時處理。

------------------------------------------------------------------------------------

轉自微信公眾號 架構師之路

,
同类文章
葬禮的夢想

葬禮的夢想

夢見葬禮,我得到了這個夢想,五個要素的五個要素,水火只好,主要名字在外面,職業生涯良好,一切都應該對待他人治療誠意,由於小,吉利的冬天夢想,秋天的夢是不吉利的
找到手機是什麼意思?

找到手機是什麼意思?

找到手機是什麼意思?五次選舉的五個要素是兩名士兵的跡象。與他溝通很好。這是非常財富,它擅長運作,職業是仙人的標誌。單身男人有這個夢想,主要生活可以有人幫忙
我不怎麼想?

我不怎麼想?

我做了什麼意味著看到米飯烹飪?我得到了這個夢想,五線的主要土壤,但是Tu Ke水是錢的跡象,職業生涯更加真誠。他真誠地誠實。這是豐富的,這是夏瑞的巨星
夢想你的意思是什麼?

夢想你的意思是什麼?

你是什​​麼意思夢想的夢想?夢想,主要木材的五個要素,水的跡象,主營業務,主營業務,案子應該抓住魅力,不能疏忽,春天夢想的吉利夢想夏天的夢想不幸。詢問學者夢想
拯救夢想

拯救夢想

拯救夢想什麼意思?你夢想著拯救人嗎?拯救人們的夢想有一個現實,也有夢想的主觀想像力,請參閱週宮官方網站拯救人民夢想的詳細解釋。夢想著敵人被拯救出來
2022愛方向和生日是在[質量個性]中

2022愛方向和生日是在[質量個性]中

[救生員]有人說,在出生88天之前,胎兒已經知道哪天的出生,如何有優質的個性,將走在什麼樣的愛情之旅,將與生活生活有什么生活。今天
夢想切割剪裁

夢想切割剪裁

夢想切割剪裁什麼意思?你夢想切你的手是好的嗎?夢想切割手工切割手有一個真正的影響和反應,也有夢想的主觀想像力。請參閱官方網站夢想的細節,以削減手
夢想著親人死了

夢想著親人死了

夢想著親人死了什麼意思?你夢想夢想你的親人死嗎?夢想有一個現實的影響和反應,還有夢想的主觀想像力,請參閱夢想世界夢想死亡的親屬的詳細解釋
夢想搶劫

夢想搶劫

夢想搶劫什麼意思?你夢想搶劫嗎?夢想著搶劫有一個現實的影響和反應,也有夢想的主觀想像力,請參閱週恭吉夢官方網站的詳細解釋。夢想搶劫
夢想缺乏缺乏紊亂

夢想缺乏缺乏紊亂

夢想缺乏缺乏紊亂什麼意思?你夢想缺乏異常藥物嗎?夢想缺乏現實世界的影響和現實,還有夢想的主觀想像,請看官方網站的夢想組織缺乏異常藥物。我覺得有些東西缺失了