暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

网络架构认知(一)

进击的大杂烩 2018-01-04
568

网络架构认知(一)



研究背景


近年来,随着运营商骨干网络飞速发展,服务器、网络设备、存储等硬件配置迅速提升,亚马逊云于2006年开创虚拟主机模式以后,国内阿里云和腾讯云紧随其后,从ISO七层模型的角度来看,这些1到3层的底层基础为7层应用程序提供了良好的温床,因而不难解释互联网行业的发展之迅猛,以百度、阿里、腾讯为首的互联网企业改变了人们的生活方式,传统制造业、副食品受到了极大的冲击,房地产行业也无法避免,同样,互联网游戏行业也发生了巨大的变化,伴随着PC的普及和硬件显卡的提升、促使了我国从传统单机游戏向当代大型3D游戏以及手游的转变。

 改革开放以后,尤其进入到21世纪,人们生活水平得到了巨大提升,人们花在消遣上的时间以及开销逐年提高,尤其互联网游戏和手游占据了我们的生活,根据《2016年游戏年度报告》,2016年收入最高的Riot Games的《英雄联盟》营收达到17亿美元,在巨大的市场环境下,H公司发布的大型3D游戏是国内唯一一款能与暴雪的魔兽世界齐头并进的游戏,与腾讯游戏合作的剑侠情缘手游在2016年一直占据微信排行榜前三的位置。

在如今的互联网时代,单机游戏很难保持营收,H公司的主要研发精力放在手游和大型网络游戏上,应用程序不断优化,游戏的美工精益求精,而且云计算、广域网、硬件等大前提为我们提供了良好的铺垫,H公司游戏业务在近5年逐年保持至少20%的增长速度,H公司在全国各大城市都设立了数据中心,数据中心的稳定性就好比地基一样,地基的牢固程度决定了楼层建筑的高度,一旦出问题,游戏的体验感直线下降,直接影响游戏创收,进一步完善数据中心运维流程,提高游戏稳定性和可扩展性以及冗余性,是目前运维部门每一位成员所面临的重要问题。

    H公司如果想要自建一套网络架构,网络设备品牌该如何抉择呢?


云网络架构简介

SDN核心思想:通过网络设备软硬件解耦,向用户开放网络可编程能力,实现业务与网络解耦,从而实现了网络资源池化并作为服务提供,释放了网络的灵活性、开放性及创新性。

狭义的SDN,一般指基于OpenFlow的SDN,是一种将网络控制功能与转发功能分离,实现控制可编程的网络架构。

广义的SDN,泛指向上层应用开放资源接口,实现软件编程控制的各类基础网络架构。目前,SDN流派众多,没有统一定义,概括起来有四大技术流派,分别以OpenFlow、OpenAPI、Overlay、NFV为代表的四大技术流派。


1、ONF提出SDN(soft difine network)------ OpenFlow

APP应用(北向接口):定义统一接口协议,允许用户根据标准协议自定义APP。

集中控制器:类似于传统网络设备的控制引擎,不再是单台设备,而是全网设备公用一个控制器。接收APP要求,收集设备信息,最终为每台设备生成转发依据,指导设备转发。

控制面分离接口(南向接口):基于openflow协议。

网络设备抽象化:无论何种设备类型,均基于多级流表进行转发(多级流表,为抽象设备的转发依据,类似于二层转发依据MAC地址表和三层转发依据Ip路由表)。网络设备必须支持流表转发,触发设备变革,即openflow交换机。



2、IETF提出SDN(soft driven network)open API开放接口+IRS统一资源管理

APP应用(北向接口):与ONF一致。

集中控制器:与ONF一致。

控制面分离接口(南向接口):定义开源API,允许存在多种形态,如基于openflow协议、基于传统的CLI/SNMP接口,基于网络设备厂家自行定义的接口。

网络设备抽象化:基于不同开源API,允许存在多种设备形态, 如支持openflow协议/流表转发的SDN网络设备,支持CLI/SNMP的传统网络设备。



3、Overlay:通过隧道的方式在现有网络架构上叠加虚拟的逻辑网络

逻辑网络的控制功能集中在软件控制器中,控制器向应用开放接口,使用户能定义虚拟网络转发行为

隧道协议: VXLAN、NVGRE、STT等等



4、NFV:核心思路是通过通用硬件承载专用软件的方式实现网络设备功能,将网络设备从“硬件盒子”转化为“虚拟机”




对四种网络虚拟化技术特点的总结,以及未来发展趋势的分析。

-----截取于华为的战略分析报告




云网络架构下的失败案例


三年前,我一个行业朋友的公司(也是我前前东家,一家做运营商的公司)准备做云计算,咨询我网络设备选用H3C或华为好还是Cisconexus好,在网络行业里混的人都知道,Cisco的产品贵,但是稳定,H3C或者华为的产品相对便宜,但在简单的传统网络架构中还是可以稳定运行,如果要做云产品,网络的稳定性直接关系到所有业务,面对这个问题,我只好做足功课。


如果是采用全新SDN架构,无法挑剔,需支持一定的标准协议,采用专业的网络设备,思科nexus系列是我在南方基地运维过的架构,南方基地所运维的移动云架构采用nexusN7018 5545 2048,所使用到的技术是nexus系列VPCFEXVRFVRF数目已经耗尽,上限是4096个),nexus系列的招牌技术“VDC”在当时的环境下没有被采用。大致原因是运营商想测试在单一默认的VDC下看下nexus运行情况,在多个VDC下,运维起来异常麻烦。


以下是我所经历过的几次重大故障


12014718ACL配置触发bug导致移动云全网中断


以下是思科给出的故障分析截图




结局是



也就是说,未来在nexusN7018上的acl中做任何操作,都要请思科的人判断是否会触发bug



220141118日在nexusN5545上配置syslog触发bug,导致移动云一半的业务中断


以下是内部出的故障报告分析截图



3、升级N5545的系统时全网中断


记忆中是在升级第二台N5545时候,导致的全网中断,我找遍在南方基地的所有邮件没有找到,总之,后来思科官方给出的答案是:暂停升级。


Nexus系列没人敢去重启nexusN7018N5545中任何一台,否则,很可能会导致全网中断,大致原因好像是5K之间的peer-link 工作机制与stp冲突,nexus稳定运行后,STP是不需要的,因为这套虚拟化网络的核心就是消除环路,但是如果关掉STPVPC起来的时候又有问题。我后来再咨询过当时运维南方基地移动云网络复杂人,据他当时的介绍,运维人每次在做网络变更的时候如履薄冰。


小结

综上,就目前本人所了解来看,仅仅排除Cisconexus架构,H公司游戏业务需要更好的网络架构,作为网络工程师的我,希望学习更新的网络架构,后续可考虑向我们的运营商咨询,比如请金某云,腾讯云等网络架构和系统架构加上软件层面的设计工程师过来。这个问题已经和涛哥商量过几次,我们的意见高度统一,金某云未来的蓝图是要做国内与腾讯云、阿里云齐名,因此,架构肯定有很多值得我们学习和借鉴的地方。






文章转载自进击的大杂烩,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论