计世网

黑龙江电力:ERP上云记
作者:宋辰 | 来源:计算机世界
2020-03-12
当初,为了让非IT从业者能理解“云计算”是什么,业内人士最爱打的比方就是“像使用水电一样,可以便捷使用计算资源的一种服务”。如今,当真正的“电”遇到了“云”,又会产生怎样的火花呢?

 

当初,为了让非IT从业者能理解“云计算”是什么,业内人士最爱打的比方就是“像使用水电一样,可以便捷使用计算资源的一种服务”。如今,当真正的“电”遇到了“云”,又会产生怎样的火花呢?

这一切要从国网黑龙江省电力有限公司(以下简称“黑龙江电力”)的ERP转型升级说起。

黑龙江电力通过分布式架构改造,最终实现了 IT 基础资源的标准化封装和按需供应,成为国网电力系统里第一家ERP“上云”的公司。

当代经济晴雨表

1882年第一盏电灯在上海点亮,在过去的100多年里,中国电力行业跨越式发展的背后是中国经济的晴雨表。

新冠疫情来临,我们不仅关注着当下的疫情防治进展,也关心着未来生活如何继续——有序复工复产成为各地方另一个工作重点。在疫情中,国网的电力公司基于电力大数据分析,先后推出了企业复工电力指数,能够分析研判不同行业、不同地区的复工情况与复工趋势,为政府分析核实企业复工情况提供数据支撑。

数据显示,截至2月20日,黑龙江省电力公司监测规上企业用户(按日用电量500万千瓦时以上划分)1517户,通过当前日用电量与2019年4季度日均用电量等数据分析,复工909户,复工用户比例59.92%。

几年前,有一份“深夜电力全球地图”曾经在互联网上广为流传。经济发达地区,深夜依旧如繁星般点亮着夜空,而经济欠发达地区,则是一片漆黑。

经济活动与用电数据具有强相关性。也就是说,通过监测企业用电情况,能够在第一时间掌握其复工复产状态,为相关经济政策出台提供有力的决策支撑。

电力公司掌握企业用电情况,企业的用电情况直接代表一个企业的活力,而家庭的用电情况,在一定程度上代表这个家庭的财政状况和消费能力。通过对相关数据的深入挖掘,电力公司就可以与银行进行征信相关的合作。

其实,从2018年开始,中国铁塔股份有限公司先后与国家电网、南方电网重磅宣布:正式签署战略合作协议,双方将大力推广输电杆塔加装通信基站设备,以及深化电力、通信行业多个领域的业务合作,开启“共享铁塔”的全新合作模式。这些都是电力行业在数字化转型过程中对自身的挖掘。

“青云QingCloud的目标是通过数字化整合,帮黑龙江电力把很多原来还没看到价值的数据的关联性、有效性进行挖掘,给电网带来新的价值,同时也是为企业、为千家万户提供更多的增值服务。这也是我们帮助企业做数字化转型的最终目的和结果。”青云QingCloud 高级销售顾问陆春鹏说。

ERP云化迁移遇难题

黑龙江电力是国家电网有限公司全资子公司、特大型国有骨干企业,承担着建设、运行维护黑龙江电网和全供电区安全可靠供电的任务。公司供电面积 47 万平方公里,占东北供电区域总面积的 58.3%,服务各类客户 1752 万户,供电人口 3800 万。

在全国电力行业,黑龙江电力体量并不大,IT投入也不高,他们更需要的是“把钱花在刀刃上”,需要“碰”到一家能从咨询、实施到后期运维,能提供端到端核心业务云化方案,并且能以整套解决方案交付的供应商。

数字化技术与电力企业的深入融合,不仅提高了运营效率,其平台化、共享化的趋势也给传统电力供应模式带来了巨大挑战。

国网ERP建设并不是这几年才出现的,早在10年前,国网电力系统就已经实现了人力资源管理、财务管理、物资管理、项目管理、设备管理等业务的全面单轨运行。当时选用的是SAP专门为电力行业提供的一套产品,以及Oracle专门为ERP定制的数据库,而硬件采用的还是原厂已经全面停止系统维保的Superdome小机和由传统集中存储 FC SAN 提供存储服务。黑龙江电力面临着ERP系统老化、性能下降,以及设备缺少厂商维护的问题。

由于系统的复杂程度比较高,黑龙江电力要求在这次ERP云化迁移过程中,把Oracle数据库系统进行升级。

在黑龙江电力ERP迁移上云之前,困难就摆在了面前。“一方面系统做不了扩容,需要迁移后具有比较好的扩容能力。二来,由于这套系统比较封闭,是典型的烟囱式、孤岛式系统,无法跟互联网创新业务相结合。这要求在这次迁移时既要保障上云后的扩展性,同时与互联网新业务还能进行数据交换和相关的延展。”陆春鹏带着这些“恼人”的问题回到了公司。

软硬兼施调架构

ERP的初衷是为了有效地管理企业供应链中最关键的各个环节。就电力行业而言,最关键的环节在调度(属于企业质量)、配送和维护,这个环节实施完成后,才是销售或分销、采购、电力市场调节的发/输/配计划;最后的环节才是金融/财务一体化。

面对国家电网对全面建成“国网云”的要求,电网企业需要建立精确的供需数据监控系统、有效的大数据分析系统和透明的多边交易系统;输配电部门不仅要为用户、分布式能源、分布式储能、综合能源服务、需求侧管理、电动汽车充电管理建立管理平台,还需要不断优化用电负荷,提高响应能力和主动应对能力。

电力行业普遍存在系统设备老化、性能低下、系统集成复杂度高、无法扩展等问题,迫切需要转型升级, 在确保 ERP 核心业务稳定运行的基础上,同时支撑 “互联网 +” 创新业务的发展。

为此,黑龙江电力将 SAP 中间件部署在青云QingCloud 为其构建的私有云平台之上,并将关键实例基于功能低耦合设计,将不同功能拆分后部署,以利于后期的扩展。黑龙江电力还选择将 ASCS 和 ERS 独立部署于云平台之上,并配置 HA (High Available,高可用)主备模式,以便管理 SAP 应用集群。“我们把所有的组件拆分开,最主要的组件单独部署,会很轻。拆开后提升了整个系统的稳定性,任意一台服务器的会话进程被占满,都可以由其他服务器响应会话请求。不会出现由于业务增长造成系统负载过重,对前端失去响应的情况发生。”青云QingCloud解决方案架构师郑子尘解释道。据青云QingCloud实测,拆分后,HA的切换时长,由原来10分钟左右降低到新架构下的1分钟左右。

在硬件架构调整方面,青云QingCloud采用业务云化,加上通用X86服务器,构建开放式架构,原有的存储网络从FC转向以太网,也大大节约了成本。同时,用分布式存储替代原有专用的集中式存储,新的分布式存储直接采用全闪架构,分布式块存储——QingStor NeonSAN的性能和容量会随着整个分布式集群节点数量的提升而提升,郑子尘说:“采购成本比采购一套专有设备低很多,同时带来的性能提升则是非常明显的——我们可以做到单卷超过10万IOPS。而传统的10-15K的机械盘,单盘的IOPS不会超过200,性能提升了500倍。”

谈到 QingStor NeonSAN优秀的全闪性能,就不得不提“能屈能伸”的英特尔傲腾技术。我们所熟悉的NAND固态盘的读、写、擦除的大小单位不一致,在写的时候需要事先做擦除才能写入。例如包含一个4KB的覆盖写的I/O,写的时候有可能需要擦除整个块,这个块的大小可能是几十兆甚至更高,这就导致I/O效率比较低,同时还会产生垃圾数据和造成写放大。而英特尔傲腾介质可以按照比特做寻址,几乎可以按照任意大小来定义读写单位,同时,几乎不会产生垃圾数据。

在混合读写应用中,英特尔傲腾 SSD的读延迟几乎不受写操作的影响,这一点对读敏感的应用改善是革命性的。同时,从每日整盘写入次数来看耐用性,英特尔高端NAND SSD P4600的DWPD(每日整盘写入次数)是3,现在英特尔傲腾介质的改善可以使整盘日写入次数达到60。也就是说,可以在盘的生命周期内写入更多的数据,而固态盘不会产生损坏。而且,在缓存应用领域,基于以上两个特点的加持,可以利用更低容量的英特尔傲腾来实现更大容量高性能NADN SSD效果,甚至更好。可以说,是英特尔傲腾为青云QingCloud的SSD提供了更好的系统效率及更高的可靠性。

一家大型电力企业的IT系统往往有上百套,应用类型更是千差万别,过去采用紧耦合的IT运维解决方案,不但部署困难,出现故障后还需要依靠IT管理者的经验和人力去逐一排查,解决问题的时间通常需要几天、甚至几周的时间。而云最擅长的是做底层资源自动化的调度及管理,极大降低因硬件失效产生的应用停机风险。

在云化的架构里,任意一台硬件节点下线或者某个硬件出现故障,都不会影响整体业务的连续性,也不会造成数据的丢失。生产环境的数据库——Oracle RAC采取物理主机的方式进行部署,相对于小型机来说更易于维护,各种备件的采购更便宜、更灵活,服务器运维人员、售后维修人员的维护工作难度也降低了,实现了成本降低和维护便利度提升。

对于关键业务上云,企业一向是持谨慎态度,尤其是对于电力行业这种国民经济保障行业来说,更是慎之又慎。从搭建沙箱环境进行PoC环境的模拟,完成软件版本与内核的验证;到开放测试架构拆分和复制,在QAS质量保证系统中进行回归测试、压力测试与用户测试,并将DEV开发系统的程序在原始环境与新环境之间做同步调试,标记将来生产系统迁移后需要补传的请求;再到生产环境迁移之前,使用沙箱环境进行迁移的模拟,记录迁移的步骤、耗时、突发问题等,进行风险的把控与调整;最后,按照设定的顺序和步骤标记生产偏移量,进行 DEV 开发系统环境的切换和生产系统 PRD 环境的迁移,从而完成整个 ERP 生产环境的迁移。

黑龙江电力的ERP上云过程就如同一场不断反复排练的大戏,只待大幕拉开的那一刻,一切如预演各就各位。

责任编辑:宋辰