网络是复杂的,而Neutron是OpenStack中最难扩展的部分之一。在本文中,我们探讨早期架构选择、推荐驱动程序,以及如果最终目标是扩展到一个非常大的部署时要避免的功能。
由于需求广泛,OpenStack Large Scale SIG重新组织了OpenInfra活动,与几个大规模部署的OpenStack运营商讨论了应对各种运营挑战的不同方法。OpenInfra基金会副总裁兼OpenStack Large Scale SIG主席Thierry Carrez和,分享了关于Neutron扩展最佳实践。具体内容请观看:https://youtu.be/4ZLqILbLIpQ。
参与讨论的人包括:Exiaon的现场可靠性工程师Ibrahim Derraz,彭博社高级云工程师David Comay,爱立信首席开发人员、现任OpenStack中子项目团队负责人(PTL)Lajos Katona,红帽公司首席软件工程师和前Neutron PTL Sławomir Kapłoński,StackHPC高级技术主管、Kolla Ansible PTL Michal Nasiadka,VEXXHOST首席执行官兼OpenStack技术成员Mohammed Naser。
Derraz向小组成员提出了一系列问题,涉及其他用户做出的早期架构选择、推荐的驱动程序,以及如果用户的最终目标是扩展到非常大的部署,应避免的功能。
架构选择:
——你会为用户推荐哪些驱动程序以实现大规模部署?
——更具体地说,用户如何根据其功能在OVS(Open vSwitch)和OVN(开放式虚拟网络)之间进行选择?
——就网络架构而言,什么是最具弹性的选择,以确保在出现故障时不会影响任何服务?
——是否有任何功能可在大规模情况下启用或远离?
硬件和性能注意事项:
——对于新用户的硬件卸载,你是否有任何反馈或建议?
——关于如何调整网络节点的大小(CPU/RAM/节点数),你有什么建议吗?
生产中的Neutron:
——生产中Neutron的常见缺点/故障是什么?要在网络节点上监控哪些关键指标?
——对于彭博社和VEXXHOST:是否有专门的网络团队面向生产?
现场观众的一些问题:
——在大规模OpenStack环境中,Neutron中心化路由(所有通信量都流向Neutron服务器)的体验如何?
——在具有数百个虚拟机监控程序的分布式虚拟路由器(DVR)中,重新启动Open vSwitch代理的时间变得更长——代理在重新启动时在从数据库中查找大量端口。有什么办法解决这个问题吗?
如果你有兴趣了解更多关于大规模用户如何解决运营挑战的信息,欢迎加入OpenStack Large Scale SIG。
对于希望与更多大型OpenStack运营商和开发人员会面,并了解他们如何升级或使用OpenStack在科研和HPC中构建超级计算机的人,可以查看以下视频:
——大规模OpenStack基础设施的升级(https://youtu.be/yf5iFiCg_Tw?list=PLKqaoAnDyfgo5sOi98QlbMVMhgI_lxFPA)
——专家们围绕大规模OpenStack部署的升级讨论权衡、频率等问题的讨论(https://youtu.be/C2fSy005lDs)
——大规模OpenStack:讨论软件定义的超级计算机(https://youtu.be/fOJTHanmOFg)
原文链接:
https://superuser.openstack.org/articles/large-scale-openstack-neutron-scaling-best-practices-openinfra-live-recap/






