EasyStack获评2016年度制造行业OpenStack最佳实践

近日,由工业和信息化部信息化和软件服务业司指导,中国信息通信研究院和中国通信标准化协会共同主办,云计算开源产业联盟承办的“云计算开源产业联盟第一次成果发布会”在京召开。

工信部信息化和软件服务业司巡视员李颖、中国信息通信研究院党委书记李勇出席会议并致辞,云计算开源产业联盟常务副理事长何宝宏主持会议。会议发布了中国首个云计算开源产业发展白皮书,以及政府、广电、电力、电信、教育、金融、医疗、制造八大行业基于OpenStack技术的最佳实践。

EasyStack合作伙伴副总监 罗云飞

EasyStack合作伙伴副总监 罗云飞

其中,制造行业OpenStack最佳实践由EasyStack助力联想集团OpenStack高可用企业云平台项目获得。EasyStack合作伙伴副总监罗云飞在会上对最佳实践进行了分享。他表示,联想采用EasyStack ESCloud全开源解决方案,将计算,存储,网络全虚拟化和计算与存储融合架构,实现以少量资源支撑20%内部IT业务系统和Moto Cloud业务,IT部门逐步由成本中心转变为创新中心。此外,EasyStack在银行、电信、电力,物流以及教育行业等等都有非常多的成果案例。

具体最佳实践分享如下:

联想集团的私有云就是其中之一,联想集团不用多说,他的交互的业务特别多,他的IT系统非常庞大和复杂,他在全球有很多的数据中心,涵盖像中间件、虚拟化、备份、安全等等各种不同的技术平台,以及数不清的业务系统,非常庞大的一个IT。这些业务系统和技术平台的特点,他们是各自独立部署的,各自成为一个体系,也就是说我们经常讲的信息孤岛的问题比较严重。

它给联想带来的困境比较多,首先第一个是效率的问题,他们在交付一个新的基础设施的时候,通常需要一个周甚至几个周的时间。但是我们知道,如果通过云计算交付的话,可能分钟级甚至秒级就可以完成,另外因为它不是自服务的,所以它需要人工去干预,需要专业的技术团队去部署和实施。这里面沟通、协调以及交付的效率都会影响它业务的上线。第二是成本,联想采用很多大型商业的系统,因为这些系统不是去自动伸缩的,它的资源利用率非常低,效率就比较低下,资源的透明度也不好,最后是安全。目前采用的都是封闭的网络设计,这些直接导致了他的应用不能很好的隔离和做到安全。

从2015年上半年开始,我们逐步去帮联想做私有云的部署,基于我们的OpenStack系统,这个是一个架构图,非常清晰明了,底层采用的是X86通用服务器加万兆的网络,另外通过像OpenStack的一些模块,比如通过KVM实现计算的虚拟化,像对象存储、块存储以及一些定向文件,我们用Ceph来存储等,上层还有一些计量、编排的能力,总体来讲这个系统是开源、开放的,我们最终做到是软件和硬件的解耦,对于联想带来的好处,他可以去灵活使用各种异构的硬件资源,而不会被任何一个技术或者一个产品去绑定,有很好的灵活性。

业务的稳定运行离不开高可用,我们在高可用上也做了一些设计,像计算、存储的这些数据,我们实现三副本的拷贝,另外为了实现不同网络、不同租户的安全,我们设计了很多的VLAN。包括管理网络,以及内部的数据私有网,还有对外的接入网络,这种VLAN都有。

当前的状态怎么样,目前完成的联想IT的一期,在北京的数据中心搭建了云计算平台,主要是为他的手机业务提供云资源,因为大家知道联想收购了摩托罗拉,后面他也不断在发展自己的手机业务,所以我们一期是在北京,他们也会逐步把北京其他的业务迁移到云上来。后面的二期我们会牵扯到像武汉等等其他一些城市的数据中心,甚至联想在全球的数据中心,都纳入进来,去做跨区域、跨数据中心的云计算资源池。在必要的时候我们会去考虑公有云的能力。

在走向移动化、社交网络的过程中,无论传统的PC与手机都经历着激烈的竞争及快速的技术转变。作为国内IT标杆企业的联想集团,在面临市场的飞速演变与竞争中提出——从产品向用户转型的新战略。而只有可快速迭代、弹性扩展的企业云平台才能够支撑联想这种业务创新的需求。经过慎重研究与评估后,联想集团IT选择EasyStack公司,基于OpenStack承载其“互联网”战略的企业云平台。经过半年多的实践,已经建设成为规模超过3000 Core的OpenStack生产级环境,数据以最高10TB/天的速度快速增长,并计划在年内将10%~20% IT负载迁移到云环境,这让联想走在了国内企业级OpenStack的实践的前列。

转型与云选型

以往的联想的内部IT主要面向大型客户以及渠道为主,系统架构以包括IBM Power小机、AIX、PowerVM、DB2及近年普遍使用的VMware虚拟化的传统IT架构构建而成。在向互联网企业转型的过程中,首先在用户数与交易量就远远无法支撑全新的B2C的业务。其次在成本方面,联想以往的IT架构是大规模采用商用化的解决方案,可靠但不便扩展且成本昂贵。

此外,对于IT团队的效率与安全合规性,传统的IT架构仍然无法支撑起联想面向电商与移动新业务转型。2015年,联想IT进入到基础架构再造的阶段——需要采用新的云计算平台来支撑新的业务。

联想的选型历程

在选型过程中,联想对主流的x86虚拟化技术、私有云平台、公有云进行了全面分析与对比后,联想从稳定性、可用性、开放性、以及生态系统的全面与活跃度等因素考虑,最终认为OpenStack云平台技术可以满足联想的企业需求,联想确定采用OpenStack作为其业务持续创新的基础云平台,并选择EasyStack作为合作伙伴一同实践前行。

高可用的架构设计

在逻辑架构上,联想企业云平台完全通过软件定义环境的方式来管理基础架构,底层采用x86服务器以及10Gb网络,引入互联网式的监控运维解决方案,并用OpenStack平台来管理所有资源。

联想企业云逻辑架构

出于高可用角度、最大化的提升云平台的系统效率,联想设计了云平台的物理架构,并采用高配置的服务器来构成计算、存储与网络一体的超融合系统,通过OpenStack整合为统一的资源池,将计算节点和存储节点放在同一个物理节点上。

联想企业云物理架构

硬件层面,双路的System X3650服务器,以及四路的ThinkServer RQ940,成为了联想企业云平台的硬件支柱。每节点用5个SSD硬盘与12个SAS硬盘来构成存储模块;SSD不仅用来做存储的缓冲,也是高性能存储池资源;并通过VM访问分布式存储,来实现系统的高可用性。

为了将OpenStack提升至企业级服务水平,我们在计算、网络、存储等方面解决了很多挑战。

计算

在计算方面,联想采用高密度的虚机部署方式,底层基于KVM 虚拟化技术,通过多种优化手段,发挥物理机最大性能,在计算存储融合架构下对CPU,内存等硬件资源做隔离。最终实现在每台双路CPU计算节点上保证50+虚机仍能平稳高效运行。

另外,在云环境里面一般提倡应用程序自身高可用来应对硬件故障,但仍然有一些应用属于传统应用,对于单个主机的可用性还有要求。对于不能做高可用的传统应用,联想通过Compute HA技术实现了计算节点的高可用,通过多种检测手段判定计算结点是否发生故障,将故障物理机上的虚机迁到其它可用的物理机上,整个过程无人值守,最大程度减少因为物理机故障导致的业务中断。

网络

——网络隔离

使用不同网卡,不同交换机或不同VLAN将各种网络隔离,如:单独的OpenStack管理网,虚机生产网络,存储网络,公网,PXE网络。避免网络相互干扰,达到提高整体带宽和更好监控网络的目的。

联想OpenStack企业云平台网络架构

——多Public网络

通过多个Public网络实现网络灵活性,便于管理安全策略。比如联通Public网络,电信Public网络,办公Public网络。

——网络及优化

使用VLAN网络模式,与传统数据中心网络更好的整合,通过优化VLAN数据包处理,达到很好的网络数据包处理能力,让虚机网络带宽接近物理网络带宽。

——双网卡绑定,多交换机

通过双网卡绑定到不同的交换机达到物理网络的高可用。

——网络节点HA

通过多个网络节点,实现公网的负载均衡及HA,实现高性能和高可用, 网络节点使用Router级别的Active/Standby方式实现HA,使用独立的网络路由监控服务确保网络HA的稳定性。

存储

联想OpenStack云平台采用Ceph作为统一存储后端,其中Glance镜像、Nova虚拟机系统盘、Cinder云硬盘的数据存储由Ceph RBD提供,利用Ceph的Copy on Write特性,通过修改OpenStack代码,可做到秒级虚拟机部署。

Ceph作为统一存储后端,其性能无疑是企业核心应用是否虚拟化、云化的关键指标之一。在计算存储共同运行的超融合部署架构中,存储性能调优既要最大化存储性能、又要保证计算和存储资源的隔离,保证系统的稳定性。针对如下图所示的整个IO栈,联想从下往上,对各层进行了优化:

——网络方面

打开Jumbo帧,提高数据传输效率;同时可采用10Gb以太网络来承载Ceph Cluster网络的流量,提高Ceph数据复制效率。

——性能方面

利用SSD固态盘作为Ceph OSD日志盘来提高整个集群IO性能,来达到关键业务(如电商系统的数据库业务等)对性能的要求,做到性能和成本的最佳平衡点。SSD 具有低功耗,响应时间短,高IOPS,高吞吐量的特点。在Ceph的日志系统,对应的是多线程访问,采用SSD来代替机械硬盘,可以充分发挥,SSD随机读写响应时间短,高IO吞吐量的特点。通过调整IO调度策略,使之更适合于SSD盘,降低了整个IO的延时。

——合理规划

根据服务器上虚拟机的密度,合理规划超融合节点下Ceph OSD的数量,并为OSD预分配CPU和内存等资源,同时,为保证系统稳定性,采用cgroup、taskset等工具对QEMU-KVM和Ceph OSD进行资源隔离。

——参数调优

Ceph参数调优方面,通过调整Journal,FileStore的默认队列、OSD的OP线程数等参数,可有效提高性能。其它更多调优参数,可通过迭代测试,找到当前硬件环境的最佳参数。

——数据高可用

数据高可用方面,除了OpenStack已有的数据保护措施之外,联想未来规划中的两地三中心也做了数据灾备方案的准备:

通过专有的低延迟的光纤专线,数据可同步存储在同城备份中心,可异步存储在异地灾备中心,最大限度保证数据安全性。

AD集成

此外,联想还将自身的业务需求融入到了OpenStack企业云平台中,作为一个拥有数万名员工的大企业,需要通过AD活动目录来进行认证,员工就不用单独再建用户、记口令等;通过协作方的定制开发,联想已将AD功能融入OpenStack企业云平台之中。

应用成果

在采用EasyStack ESCloud方案后,推动联想集团向”PC+”、”互联网+”转型,支持大数据、电子商务、智能硬件、MotoCloud等创新业务。 混合云连接器对接公有云实现业务弹性。通过超融合架构和虚拟机高密度设计,实现云主机成本低于公有云。多数据中心运行多业务系统,数据中心间异步数据复制,保证业务安全和数据安全。

上一篇:烽火18台系列之六——网站群安全治理的核心能力解析

下一篇:赛可达发布2016最新手机安全软件查杀能力横评报告