设备虚拟化技术
MSTP+VRRP不足
传统MSTP+VRRP设计

传统MSTP+VRRP组网的难点

VRRP多实列的分担设计需要详细规划master的归属
MSTP多实例设计需要详细规划VLAN和生成树实例的归属
IP网段规划需要学习规划下联上联三层接口IP网段和VRRP虚拟IP网段
网络拓扑结构复杂
- VRRP多实列需要详细规划master的归属,MSTP设计需要详规划VLAN和生成树实例的归属
故障恢复一般在秒级,如VRRP收敛最少需要3秒
为了破环需要堵塞某些端口,造成了带宽的浪费
设备虚拟化的优势
虚拟化的优点
简化管理
- 多台交换机做了IRF之后,管理员可以统一管理,而无需分别对这些交换机进行配置;
简化拓扑
- 多台交换机做了IRF后,在网络中相当于一台交换机,不存在环路,故无需配置MSTP协议
便于扩展
- 往现有IRF中加入新设备非常容易
扩展端口数量

- 当接入的用户数增加到原交换机端口密度不能满足加入需求时,可以通过增加新交换机与原交换机组成堆叠系统来实现
扩展系统处理能力
- 当中心的交换机转发能力不能满足需求时,可以增加新交换机与原交换机组成堆叠系统来实现

扩展带宽

- 当边缘交换机上行带宽增加时,可以增加新交换机与原交换机组成堆叠系统来实现。
- 支持跨内部设备链路聚合:增加带宽,避免网络拥塞,加强网络稳定,减少单点故障,环路避免
虚拟化简化路由管理

各大厂商设备虚拟化技术比较

IRF概述
- IRF(Intelligent Resilient Framework,智能弹性架构)是将多台设备通过堆叠口连接在一起形成一台“联合设备”

IRF发展历程
- IRF1(2004年)低端设备横向虚拟化,解决接入层的网络扩容和管理维护问题
- IRF2(2009年)全系列设备横向虚拟化,表项同步、跨机架链路聚合、负载分担、统一管理
- IRF3(2013年)纵向虚拟化;将整个网络虚拟化为一个管理节点,降低管理难度并简化了布线
IRF1.0
- 通过堆叠口将多台接入设备连接起来形成一台虚拟的逻辑设备
- 通过此虚拟设备可以管理堆叠中的所有设备
- 这种虚拟设备成本低廉却具有很强的扩展性和较高的可靠性
- 但IRF1仅能对盒式设备进行堆叠
IRF2.0(当前版本)
IRF2将网络中同一层多台设备横向整合成一台逻辑设备
- 同层多节点合一,多链路被捆绑成单链路
- 无需复杂VLAN+MSTP/VRRP配置,收敛时间大幅降低
- 路由与VLAN规划极大简化
- 单个物理节点、链路故障不影响上层路由
- 管理节点明显白变低
IRF2支持对框式设备的堆叠
IRF3.0
- IRF3.0在IRF2.0的基础上增加了纵向虚拟化,将三层网络拓扑简化为了一个大二层网络拓扑

- 目前的IRF3.0的核心思想是将多台PEX设备(Port Extender device)连接到父设备(Parent device)上,进行必要的配置后,将每台PEX设备虚拟化为父设备的一块远程业务板,由父设备统一管理
- 使用这种虚拟化技术可以以较低的成本,来提高父设备的接口密度,简化网络拓扑,降低网络维护成本。
IRF的运行模式
IRF有两种运行模式
- 独立运行模式:处于该模式下的设备只能单机运行,不能和别的设备形成IRF。
- IRF模式:处于该模式下的设备可以与其它设备互联形成IRF
两种模式之间通过命令行进行切换
IRF拓扑类型
- IRF支持两种拓扑类型,分为环型连接和链型连接,其中环形连接可靠性更高

IRF设备的角色
- Master:负责管理整个IRF
- Slave:作为Master的备份(v7版本中为Standby)

一个IRF中同时只能存在一台Master,其它成员设备都是Slave。Master和Slave均由角色选举产生,成员优先级越大的越优
display irf 命令显示信息描述
MemberID: 本IRF 中成员设备的编号
- 如果编号前带“*”,表示该设备是Master 设备;
- 如果编号前带“+”,表示该设备是用户当前登录的、正在操作的设备)
Role: 本IRF 中成员设备的角色,取值可能为:
- Slave:备用设备(V7版本中为Standby)
- Master:主用设备
- SlaveWait:正在加入IRF
- Loading:正在自动加载系统启动文件
Priority: 成员设备的优先级(取值范围为1~32)
CPU-MAC: 设备的CPU MAC 地址
The bridge MAC of the IRF is:IRF 的桥MAC 地址
Domain ID:IRF 域编号(域编号用来区分不同的IRF,域编号相同的交换机才能组成IRF)
1:N协议热备
IRF采用1:N冗余,即Master负责处理业务,Slave作为Master的备份,随时与Master保持同步。当Master工作异常时,IRF将选择其中一台Slave成为新的Master,接替原Master继续管理IRF系统,不影响网络转发

IRF协议热备份功能负责将各运行协议的配置信息和运行状态等同步到其它所有成员设备,与单框设备的双引擎工作方式相似,从而使得IRF系统能够作为一台独立的设备在网络中运行。
成员设备间报文转发方式

- 对于多台盒式设备组成的IRF系统,由Master计算并形成各成员的转发表;
- 对于多台框式设备IRF,由Master设备的主用主控计算生成转发表,各框线卡的转发表均由此主控同步下发。
- 当数据流在IRF系统的成员设备间转发时,交换机硬件ASIC根据转发表信息和报文头抽取源端口号、转发出端口号、其它信息组装成IRF系统内数据转发的附加信息头IRF Head,并封装在以太网报文前面通过IRF互联链路转发到其它IRF成员,便于出方向设备进行正确处理。(措辞清楚一点)
跨设备链路聚合

- IRF的不同成员设备的端口可以被聚合在一起被当作一个逻辑端口,在配置与组网与单台设备的端口聚合功能相同。
- IRF架构下的聚合端口链路负载分担采用“基于本地优先转发的方式”。
- A-B、C-D为两组IRF系统组成两层网络,两个IRF系统通过四条链路全连接,此四条链路被聚合成一条逻辑链路;
- 当上游设备流量(红色)到达A设备需要向下游转发时,A只将流量在本地聚合组的两个端口成员内以硬件HASH进行流量均衡,对B设备也作相同处理;
- 只有当IRF成员本地没有业务出口中B的下行端口全部故障时,数据流量才到IRF的其它成员向下转发。因此就近本地优先转发的机制可充分发挥IRF成员的性能,并在链路故障时流量自动绕行;
IRF合并
- 合并:两个IRF各自已经稳定运行,通过物理连接和必要的配置,形成一个IRF,这个过程称为IRF合并(merge)

- 合并后的IRF会在原来的两个Master设备中选出新的Master
IRF分裂
- 一个IRF形成后,由于IRF链路故障,导致IRF中两相邻成员设备物理上不连通,一个IRF变成两个IRF,这个过程称为IRF分裂(split)

- 分裂后,不含有原Master设备的IRF区域会重新选举新的Master;含有原Master设备的IRF区域不改变Master角色。
IRF端口与IRF物理端口
- IRF端口:一种专用于IRF的逻辑接口,分为
IRF-Port1
和IRF-Port2
。它需要和物理端口绑定之后才能生效。在独立运行模式下,IRF端口分为IRF-Port1和IRF-Port2;在IRF模式下,IRF端口分为IRF-Portn/1和IRF-Portn/2,其中n
为设备的成员编号。 - IRF物理端口:设备上可以用于IRF连接的物理端口。IRF物理端口可能是IRF专用接口、以太网接口或者光口。
- 通常情况下,以太网接口或者光口负责向网络中转发业务报文,当它们与IRF端口绑定后就作为IRF物理端口,用于成员设备之间转发报文。可转发的报文包括IRF相关协商报文以及需要跨成员设备转发的业务报文。
IRF工作原理
IRF工作原理–物理连接
- 要形成一个IRF,需要先按照以下规则连接IRF物理端口:
- 本设备上与IRF-Port1绑定的IRF物理端口只能和邻居成员豆包IRF-Port2口上绑定的IRF物理端口相连,本设备上与IRF-Port2口绑定的IRF物理端口只能和邻居成员设备IRF-Port1口上绑定的IRF物理端口相连
IRF工作原理–拓扑收集
- 每个成员设备都在本地记录自己已知的拓扑信息,通过和邻居成员设备交互IRF Hello报文来收集整个IRF的拓扑。
- (1)初始时刻,成员设备只记录了自身的拓扑信息;
- (2)当IRF端口状态变为up后,成员设备会将已知的拓扑信息周期性的发送出去;
- (3)成员设备收到邻居的拓扑信息后,会更新本地记录的拓扑信息。
- 经过一段时间的收集,所有设备上都会收集到完整的拓扑信息(称为拓扑收敛)。此时会进入角色选举阶段。
- IRF Hello报文携带IRF端口连接关系、成员设备编号、成员设备优先级、成员设备的桥MAC等内容。
- IRF Hello报文周期性的由UP的IRF端口发送给邻居。
- 经过一段时间,所有成员都会收集到完整的拓扑信息(链路拓扑和接口信息等)。
IRF工作原理–角色选举
- 角色选举规则如下:
- (1)当前Master优先(IRF系统形成时,没有Master设备,所有加入的设备都认为自己是Master,会跳转到第二条规则继续比较);
- 本地主控板优于本地备用板;
- 成员优先级大的优先;(优先级未修改时默认值为1)
- 系统运行时间长的优先(各设备的系统运行时间信息也是通过IRF Hello报文来传递的);
- 桥MAC地址小的优先。(跟之前CPU MAC关系)
IRF工作原理–IRF的管理和维护
- 角色选举完成之后,IRF形成,所有的成员设备组成一台虚拟设备存在于网络中,所有成员设备上的资源归该虚拟设备拥有并由Master统一管理。
- MAD检测:当IRF分裂时能够检测出网络中同时存在的多个IRF,并进行相应的处理,尽量降低IRF分裂对业务的影响。
MAD检测

当IRF系统分裂后,会在网络中形成两组或多组“完全相同”的设备组,均有相同配置的Active Master。因此IRF附加了检测和冲突处理,称为多Active检测(Multi-Active Detection,简称MAD)。MAD的两种实现方式:
LACP方式:,H3C对LACP进行了扩展开发,在LACP协议报文中增加IRF Master ID ,当系统分裂后,分裂后的IRF系统有各自的Active Master ID,可通过LACP进行传递检测。
BFD方式:通过在BFD中扩展Master ID来检测冲突。
冲突处理:IRF分裂后,系统会检测到网络中存在多个处于Active状态相同的IRF。Master成员编号小的处于Active状态的IRF系统会继续正常工作,Master成员编号较大的处于Active状态的IRF会关闭该系统中所有成员设备上除保留端口以外的其他所有物理端口。
故障恢复:IRF系统通过日志提示用户修复IRF互联链路,链路修复后,冲突的设备重新启动,恢复IRF系统,被Down掉的端口将重新恢复业务转发。
IRF配置案例
H3C:
