上一篇文章已經了解到如何學習MAC和根據MAC查表得到輸出結果。輸出結果有兩種可能,一種是確定的輸出端口號,指示分組從確定的端口號輸出;另一種是查不到匹配表項,需要廣播(泛洪)輸出。交換機除了正常端口號輸出和廣播輸出外,還有一種方式就是多播輸出。要求同一個分組從指定的多個端口分別輸出。
分組輸出是單播還是多播是根據其MAC地址的標識來區分的。
1)單播
單播的分組如何識別,有什么特征區分呢?從MAC地址的設計上做了嚴格的區分。MAC地址一共6個字節,其第1個字節的最低位bit值如果為0,則表示其是一個單播MAC地址。單播地址是分配給每一個單獨網卡使用的物理標識地址,所以一個單播地址是肯定對應到一臺單獨的主機。單獨的主機肯定是連接在交換機的一個特定的端口上面,故單播地址分組轉發,也就是一個單獨確定的端口號,其端口標記用一個數字表示即可。
2)多播
與單播相對,其標識定義也就是MAC地址的第1個字節的最低位bit是1,則表示一個多播地址。特別的,如果MAC地址的所有bit位都是1,則表示一個廣播地址。多播與單播的差異除了MAC地址的標識不同外,另外最大的區別就是,一個多播地址代表的是一組主機,可以是包含1臺或是多臺主機。那多播地址的分組轉發,如何確定給哪些主機發送,從哪些端口轉發呢?在MAC轉發表中是用多行記錄來表示,還是在端口那一列用多個端口號數字來表示呢?下面介紹一種新的端口表示方法。
廣播是一個多播的特例,是一個要求所有節點都必須加入的特殊組。多播在有些時候也叫組播,這其實是網絡層的叫法,與其相應的網絡層傳播方式還有任播。網絡層的組播有專門的組播協議實現方法,網絡層的組播IP地址與MAC層的MAC地址有著一一對應的關系,具體協議和轉換可網上搜索學習,轉換算法在后面文章代碼中會有提到。
多播既然是表示一組主機的集合,那這個集合如何學習而來,轉發的時候又根據什么樣的端口信息進行輸出呢?
1)多播學習
首先,通過組播協議學習,我們知道,主機發布入組消息,其實并不是為了通知交換機,而是通知網關。對交換機而言,如果想支持更好的組播轉發是需要監聽Internet組管理(IGMP)協議的,也就是要處理二層以上的內容。如果只想簡單粗暴的確證組播功能,則可以把所有的組播消息當作廣播來處理即可。只是這種粗暴的方式會給網絡流量、管理和用戶體驗來說帶來諸多蔽端。
通常支持組播管理的交換機可以用兩種不同的方式來實現,第一種是帶一個輕量級的處理器,可以支持對二層以上更多協議進行處理,則交換機可以實現更多復雜的功能。另外一種是根據場景要求,讓硬件支持特定的管理協議。硬件對組播的支持不需要靈活性,比如只支持IGMPV3協議,則可以直接根據該協議內容僅需關心的幾個字段直接提取數據便可完成協議處理,不像軟件那樣做逐層的解析和判斷。IGMP具體需要用到的字段有Record Type,用來指示是入組還是退組。Multicast Address用來表示IP組播的地址,根據該地址可以映射其對應的多播MAC地址。
多播通過上述簡單的字段提取后可以學習多播MAC的加入或退出,其最終結果是對應到一個多播MAC和其組端口號的映射關系上,如果某個端口上接收到了IGMP的入組信息,則將該協議中入組的組播IP轉換后的多播MAC與其輸入端口保存到MAC轉發表中,說明,一旦有目的MAC地址為多播MAC的數據收到,則需要轉發到該端口上。相反,如果收到IGMP的退組信息,則要將該多播MAC與其端口號信息刪除。
2)多播轉發
多播MAC與端口信息可以通過上面的方法學習到或刪除了,那如果在一個交換機上,一個多播MAC有多個端口都有主機加入,則該多播MAC有多個端口號與其組成轉發表,那我們應該如何來構建組播MAC的轉發表呢?
先試想一下,如果將其像單播MAC映射表項一樣,在MAC轉發表中添加多行記錄,一個多播MAC有多少個端口入了組,就添加多少條記錄,是否可行。答案當然是可以,但進一步分析查表過程,如果一個MAC有多條表項可以匹配,則每一次查表都要把全表遍歷,不然肯定無法得到一個多播MAC所有的端口號信息。這對查表性能來說肯定影響巨大,其影響大小跟表項大小成正比。那我們考慮建立單獨的多播表是否可以呢?多播地址多了后該表條數也會變大,查表性能也會存在問題。
既然從表項行的角度無法解決問題,那我們可以從列的角度來考慮,原來一個MAC地址對應一個端口,用一個列表示,那多個端口可以用多個列表示即可。用軟件的思路可能還會考慮到用鏈表來表示端口組信息,這些當然可以,但從資源和性能上考慮都還不夠,特別是卸載到硬件實現。
下面,我們講一種硬件的常用思維,用bitmap方式表示端口號。Bitmap顧名思義就是用每一個bit位表示一個對應的端口,從低位開始,數字1(bit表示:01)表示0號端口;數字2(bit表示:10)表示1號端口;數字3(bit表示:11)表示0和1兩個端口。交換機端口一般不超過64個,那用64位數據類型即可全部表示所有端口信息。
1)多播學習
多播學習我們在軟件將采用協議逐層解析的方式獲取我們關心的數據。為了軟件代碼實現簡單,多播學習的表項單獨存儲在一個多播MAC轉發表中,某個端口的主機加入了一個組,我們則在多播MAC轉發表中添加該組的多播地址與對應端口的bitmap表示值。當有其他端口加入了相同的組,則在原有端口字段上更新其對應端口的bit位的值即可。
2)端口Bitmap表示
根據端口號的bitmap表示,上述多播MAC地址學習后只需要一條表項表示即可,在查表過程中,再也不用遍歷全表查找。那我們是否可以將多播表和單播表放一塊呢?軟件是可以的,硬件是不會的。對硬件來說,其資源無比珍貴,每1bit都是錢。單播的端口號只能是一個確定值,對最大64個端口來說,其最多只用6bit即可表示,其他bit都是多余,故在硬件交換邏輯中,單播表與多播表是分開的,其端口號的表示大小也根據其硬件端口數量來確定bit位的寬度。單播不采用bitmap方式表示,除了存儲資源浪費還有一個主要原因就是邏輯與計算資源的浪費。采用bitmap必須逐bit是比較是否為1,是1則該端口輸出,輸出最壞情況是遍歷所有bit位。單播本來就是一個確定端口輸出,使用bitmap的方式只是造成處理邏輯的復雜化與計算時間的空耗,故單播輸出端口使用常規方式表示。
下一篇文章具體講一下多播表定義、實現與相關代碼修改。
歡迎您和學生們加入FAST開源項目群溝通與探討,一起體驗不一樣的系統設計過程。請先加微信號15116127200后邀請入群。

關注FAST開源社區
FAST一一開源、開放、高速、高效、可編程、可定義!軟硬件協同并行處理。