摘要:通过对政务云平台总体架构、网络拓扑和容灾备份等关键技术的研究和设计, 给出基于云计算架构的智慧政务云平台的实现方案。政务云平台能够节约建设成本, 降低政府财政支出, 同时大大缩短业务上线周期, 减少运维难度。本方案已经在部分先进省市信息化项目中落地实施, 取得显著的效果和宝贵的实践经验。
一、前言
为了促进服务型政府建设, 推动政务大数据产业的发展, 满足电子政务、电子商务等信息化快速发展的需求, 避免信息化建设未来发展中可能出现的重复建设及信息孤岛问题, 将政府各部门建设信息系统都需要的基础设施从各自的业务应用中剥离出来, 集约建设、统一管理、按需使用, 形成共享资源池已成为当务之急。目前政府信息化建设的主要矛盾如下。
(1) 新建系统周期较长, 投资成本高
目前大部分政务系统均配置专属的服务器、存储和网络设备, 从规划、立项、采购、建设到交付的周期, 往往按年计算。同时, 由于系统独立运行、硬件无法共享, 资源利用率十分低下, 产生大量重复建设问题。
(2) 运营维护效率低, 管理成本高
政务系统硬件均通过单独的项目采购, 往往包括多个厂商, 无法做到统一管理。因此网管系统只能实现基础设施的监控, 无法做到告警的关联分析和故障的快速定位, 导致大部分工作依然靠人工的方式处理, 运维效率低下。
由于云计算技术的快速发展, 建设智慧的政务云资源池是解决以上问题的重要途径。
政务云能基于VDC (Virtual Data Center, 虚拟数据中心) 实现多政府部门、多业务应用的资源共享和按需服务, 通过云管平台实现整个云资源池的统一运营和运维, 达成跨区域、跨部门的信息共享, 满足业务不断发展和随时变化的需要。
二、政务云平台总体架构设计
政务云平台的建设是一个复杂、社会化的工程, 需立足于较高的建设起点, 以长远的眼光通盘考虑。政务云总体设计应充分考虑目前业务系统的内部整合, 以及资源灵活调配、统一管理的业务需求。为了完善随需应变的应用环境, 政务云平台的建设既要考虑技术先进性, 又要遵循简化、共享、标准、动态的原则进行。
(1) 采用层次清晰、结构完整、开放共享的技术支持框架, 实现目前条块分割、烟囱式的架构向统一、协同、开放的架构转变, 打造政务信息资源整合和信息交换的中央枢纽, 以持续、稳定、安全的架构支撑政府公共服务一体化、个性化、智能化。
(2) 各部门按照数据向上集中、服务向下延伸的建设思路, 充分利用电子政务云平台上的公共基础设施及政务应用系统, 建设本部门业务应用, 形成统一证书认证、统一数据中心、统一网站入口、统一安全支撑以及各应用系统互联互通的工作模式。
(3) 机房资源、网络资源、 (物理/虚拟) 计算存储资源、数据资源、软件资源、服务运营运维、安全管理全局共享, 并根据业务运行情况实现平峰错谷和弹性伸缩。
政务云总体架构设计如图1所示, 主要由基础设施层、资源管理层和云运营运维管理层组成, 另外还提供安全和灾备能力。
基础设施层:服务器、存储、网络等物理设施, 构成融合资源池的基础架构。
资源管理层 (虚拟化层):基于Open Stack统一管理主流虚拟化软件, 对计算、存储、网络等物理资源进行虚拟化, 提供统一的资源池和基础的运维能力。
云运营运维管理层:统一管理多个数据中心资源层提供的资源池, 提供统一运营和运维管理, 构建统一的融合资源池, 实现资源共享。
云运营运维管理层可以分为运维系统和运营系统两部分。
运营系统主要提供数据中心服务管理, 提供V D C服务、云主机服务、物理机服务、云磁盘服务、网络服务及应用部署服务。
运维系统提供对多数据中心的统一运维管理能力, 包括资源管理、告警管理、拓扑管理、性能管理以及统计报表等。
政务云基于云运营运维管理层提供的运营和运维能力, 匹配业务场景, 通过服务目录向各需求单位提供各类服务, 承载各部门政务应用。通过VDC服务的形式进行资源的灵活分配, 实现VDCaa S (VDC as a Service, VDC即服务) , 在VDC内部进一步通过云主机、物理机、云存储、弹性IP地址等服务提供自助资源发放, 实现Iaa S, 同时实现政务云平台的容灾备份, 保障关键业务的连续性。
图1 政务云总体架构设计
三、政务云平台详细网络设计
在进行网络设计前, 首先要根据业务系统情况, 对政务云平台进行安全域划分, 建议划分为互联网区、政务外网区以及专网托管物理分区, 分别承载三个分区的业务系统。在互联网区和政务外网区之间可以部署数据缓冲区, 实现跨区数据交换。政务云安全域划分设计如图2所示。
互联网区:承载政务直接面向互联网用户的业务系统资源区, 包括政府门户网站、网上服务大厅、市民服务中心等。
政务外网区:承载政务外网业务, 包括民政、工商、税务等各委办局专业业务。
专网托管区:承载政务专网中相对敏感的业务系统, 或一些不适合在虚拟化环境中运行的系统, 与其他区域进行完全物理隔离。
数据缓冲区:部署数据交换管理平台 (网闸或防火墙) , 可以对互联网区和政务外网区进行数据交换, 同时进行数据的清洗和脱敏等处理。
根据政务云平台的分区设计, 以互联网区为例, 进一步对云平台组网进行详细设计, 将区域分为核心交换区和业务功能区, 业务功能区中包括业务、存储、管理三个平面 (根据业务需求可再增加数据备份及同步平面) 。业务平面中, 包括业务区、测试区、大数据区等多个子资源池, 具体如图3所示。
图2 政务云安全域划分设计
在详细设计中, 核心交换区的功能主要是完成各服务功能分区之间数据流量的高速交换, 是数据中心南北向流量和东西向流量的交汇点。核心交换区主体采用两台核心交换机构建双网双平面架构, 通过多条链路聚合技术保证网络的高性能、高可靠。核心交换机支持SDN (Software Defined Network, 软件定义网络) 和Vx LAN (Virtual Extensible LAN, 虚拟扩展局域网) 等功能, 通过虚拟化技术实现多实例, 每个实例均拥有独立的处理能力和运行环境, 可以实现安全域划分和故障域隔离, 在提升设备资源利用率及可靠性的同时, 降低网络安全风险。同时, 核心交换区提供对业务流量的控制和优化, 如安全控制、负载分担等智能功能。核心交换机串联或旁挂防火墙设备, 实现访问数据中心业务的南北流量及区间互访东西流量的安全控制。
图3 互联网区详细网络设计
业务功能区按照业务部署和运行要求, 划分为业务区、测试区和大数据区, 满足不同性能要求的业务系统部署。各区可在存储设备上划分不同的存储池, 但采用相同的网络方案接入核心交换区可简化网络设计, 降低维护难度。单台机架服务器分别连接业务网络、存储网络、管理网络三个不同的网络平面:业务网络服务器提供万兆光口对接接入交换机, 提供业务数据访问网络, 通过大带宽满足业务交互和对外提供服务的带宽要求;存储网络服务器提供光纤接口, 采用光纤交换机构建独立的光纤网络, 实现SAN存储设备的高速访问;管理网络带外管理采用千兆网络, 接入带外管理交换机, 提供物理设备带外管理, 带内管理流量接入业务交换机, 通过VLAN与业务平面实现逻辑隔离, 通过链路的主备绑定, 提升管理网络的可靠性。
图4 政务云灾备设计
四、政务云灾备设计
政务云承载着大量政务系统, 其重要性不言而喻。为了保证系统的高可靠性, 可以通过建设双活数据中心进行异地容灾, 确保在单个政务云节点出现故障的情况下, 业务可以切换至容灾节点。政务云要实现双活, 必须在各个层面实现灾备设计, 具体如图4所示。
在网络层面, 可以通过部署GSLB (Global Server Load Balance, 全局负载均衡) 设备实现资源访问在两个政务云节点之间的调度。负载均衡设备能够对用户的访问进行智能分析决策, 返回给用户一个最佳的服务地址, 同时对访问应用集群的流量进行合理调度, 如果集群中某一节点不可用, 则将该节点移出集群, 把访问流量分配到其他可以正常工作的节点。根据业务访问模型的不同, 政务云提供高可靠的网络互联, 通过Vx LAN技术实现双数据中心大二层互通, 形成跨节点的双活网络, 允许应用集群、虚拟机跨节点部署、迁移, 并且进行访问路径的优化, 使客户端就近访问业务所在的政务云节点。
政务云上, 各个委办局的业务系统部署一般分为业务服务器和数据库服务器。根据业务系统对性能的不同要求, 业务服务器建议采用虚拟化部署方式, 数据库服务器建议采用物理机部署的方式。在应用层面, 可采用应用集群和虚拟机迁移等技术, 提供用户跨节点的高可用和应用访问调度能力, 通过数据RAC (Real Application Cluster, 真正应用集群) 等技术部署或集群方式实现两个数据中心间的数据库实时同步和双活。配合监听及应用程序故障转移技术, 数据库集群在服务器或单个节点出现故障时, 能够使客户端在新的连接中继续工作, 防止业务中断。
在存储双活方面, 可使用双写技术, 上层应用在两个政务云节点同时读写、存储, 写入数据的同时写入两个节点的存储, 最大程度保证数据的可靠性和一致性, 并且做到存储、读写时延的性能优化。双活存储镜像采用光纤互联, 两政务云节点相距25km以内可采用裸光纤直连, 如果距离超过25km, 建议使用OTN (Optical Transport Network, 光传送网) 波分设备构建两数据中心的同城网络。部署OTN波分设备时, 建议采用1+1主备线路双发选收的方式, 提供物理链路的高可靠性, 一条裸光纤中断时, 另一条裸光纤可马上恢复业务流量, 切换时上层网络及应用无感知。
结合应用双活和存储双活, 可以推动智慧政务云实现最高级别的业务连续性, 确保业务系统设备出现故障, 甚至单数据中心出现故障时, 业务无感知并自动切换, 实现RPO (Recovery Point Objective, 恢复点目标) =0、RTO (Recovery Time Objective, 恢复时间目标) ≈0。
五、结束语
通过政务云的建设, 大大降低政府部门的信息化投资风险, 提高业务上线速度, 同时能够对多个政务系统的基础设施进行统一规划、统一管理、按需使用和资源共享。政务云还通过全方位的网络安全和容灾备份设计, 提高业务系统的风险抵御能力, 确保政府对外服务的不间断性, 为政府的服务转型奠定良好的基础。同时, 政务云是智慧城市发展的重要一环, 政务云结合物联网、大数据等关键技术, 向下实现城市发展更泛在的互联, 向上实现政务数据更智能化的分析, 这是下一步重点研究的方向。