华为云智能数据湖FusionInsight 成功助力10000+大数据集群滚动升级!

2020-05-14 17:54:04 来源:IT之家
华为云智能数据湖FusionInsight 成功助力10000+大数据集群滚动升级!

  随着政企数字化发展,大数据在政府、金融、运营商、大型企业等中承载越来越多的关键数据分析、处理的业务,在日常升级和维护过程中,对于业务连续性保障的要求也越来越高。每次升级操作的窗口准备时间要求尽量短,同时需要实现大集群滚动升级时业务不停机,如何处理这些痛点,成为了业界关注的重点。

  近日,华为流程IT的大数据集群(大数据集群是对大数据从数据获取、数据存储和数据分析的集群)使用华为云EI智能数据湖FusionInsight升级管理可视化服务工具,成功处理了升级过程中每天10万+任务要求业务不中断、大版本滚动升级、意外场景、开源版本等问题。本次成功升级的华为流程IT大数据集群规模达10000+节点,数据容量1000+PB,升级到新版本后,单集群规模最大可以支持到20000节点,可满足华为流程IT业务高速发展的需要。

  华为流程IT的大数据集群是基于华为云EI智能数据湖FusionInsight,面向数个部门,提供批流计算、多维分析、数据仓库、ETL、数据治理、可视化平台等基础能力,高效支撑各个产品和解决方案的数据分析过程。2019年,随着华为流程IT业务的飞速发展,大数据集群规模也急速增长,1年时间,数据总量增加了3倍,数据表增长了1.2倍,CPU使用率持续高达70%。现网集群已经稳定运行超24个月。今年在业务高速增长的背景下,为了满足大数据计算、存储的需要,急需扩大规模和数据容量。

  华为云EI智能数据湖FusionInsight基于华为云为业界提供公有云、混合云的大数据解决方案,采用高性能的BMS和ECS,轻松满足企业数据处理业务需要。FusionInsight MRS大数据产品采用云化架构,架构灵活,最高可满足3万大集群使用和管理,满足企业高速的业务增长分析需要,数据分析价值最大,使数据“慧”说话,使企业更智能。

  基于此,下面一起看下华为流程IT的1万+超大数据集群的成功滚动升级过程中,华为云EI智能数据湖FusionInsight起了什么样的作用。

  在本次升级面临的挑战:

  1.业务不中断:大数据集群每天为1000+租户提供服务,需要10万+任务在升级过程中不中断。

  2.大版本滚动升级:从Hadoop2.X升级到3.X,开源社区仅提供了HDFS的跨版本升级能力,Yarn前后两个版本无法滚动升级;Hive从1.x到3.x版本,前后元数据格式不兼容、API有变化、语法不兼容等问题,导致无法支持滚动升级。

  3.进度不中断:集群规模达万余节点,集群升级历时数天,升级过程中需要应对各种突发事件,例如硬件的磁盘故障、网络拥塞等各种异常场景,要求不中断升级。

  4.开源版本需改进:在升级过程中,存在HDFS删除的文件并不会真正删除,仅做了标记,会导致升级期间有效容量快速占满;HDFS文件块结构发生变化,导致升级后块丢失;Hive的时间戳字段,发生变化,导致升级后业务数据无法正常使用等问题。

  为了保障大集群升级过程的平滑,应对这些挑战,FusionInsight团队提供了升级管理可视化服务工具,可以端到端分步骤的完成滚动升级,实现升级过程中的可视化控制和管理,并应对上述挑战,主要做了如下处理:

  1. 为降低在升级过程中对关键任务SLA的影响,提供了按升级批次进行暂停的能力,关键作业或者作业高峰时段,可以暂停升级动作,保障关键任务平稳执行。

  2.在版本开发阶段,由开源社区PMC、社区Commiter、研发工程师共同组建了滚动升级小组,解决了社区协议不同、元数据格式不同、API变化等导致的兼容性问题,实现了在滚动升级过程中,客户可以继续使用未升级的软件设备上进行业务处理(华为已将发现的通用问题回馈给了开源社区)。

  3.为快速处理升级过程中出现的硬件故障,提供了故障节点隔离能力,在故障发生时,可以跳过改节点的升级动作,使得故障处理和升级可以有序进行。

  4.针对HDFS的社区处理,华为在商用版本上做了标记删除文件的清理,旧版本上提供了定期清理的工具。

  本次成功将华为流程IT的10000+大数据集群滚动升级,单命名空间的上限提升到数亿,实现Kunpeng、X86服务器的混合部署,为大集群运维管理提供了近1000+精细化管理指标及在线日志检索能力,提升维护效率,单集群规模最大可以支持到20000节点,可满足华为流程IT业务高速发展的需要。

  通过上述案例,可以看到,使用华为云EI智能数据湖FusionInsight MRS大数据云服务,使得企业在10000+大集群的运维管理升级变得更加平滑和简单。

  截止2020年5月,华为云EI智能数据湖FusionInsight已经应用于全球60个国家及地区,服务于3000多个客户,拥有800多家商业合作伙伴,广泛应用于金融、运营商、政府、能源、医疗、制造、交通等多个行业。

  2019年9月18日,华为云EI智能数据湖FusionInsight大数据连续三年获得工信部中国大数据企业50强榜单第一名。

  2017-2019年华为云EI智能数据湖FusionInsight大数据连续三年在Gartner分析型数据管理解决方案魔力四象限中处于入围中国厂商的领先位置。

免责声明:本文仅代表作者个人观点,与朝闻天下无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
    本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,若因作品内容、知识产权、版权和其他问题,请及时提供相关证明等材料并与我们联系,本网站将在规定时间内给予删除等相关处理.

猜你喜欢

智能家居技术的未来:从基础到前沿

随着科技的飞速发展,智能家居已经成为现代生活的一部分。它不仅提高了我们的生活质量,还为我们带来了前所未有的便利和安全。要实现真正的智能家居,需要哪些关键技术呢?本文将探讨这些技术,并分析它们如何共同作

4天前

智能家居控制系统:未来生活的智能管家

随着科技的飞速发展,智能家居控制系统正悄然改变着我们的生活方式。它如同一位无形的智能管家,通过集成先进的物联技术、人工智能算法与大数据分析,让家这个温馨的港湾变得更加智能、便捷与舒适。从自动调节室内温

4天前

在科技数码领域,创新与变革的浪潮从未停息。一系列令人瞩目的技术突破和市场动态正重塑着我们的数字生活。从人工智能到量子计算,从5G络到物联,每一项技术的进步都在推动着社会向前发展,同时也带来了前所未有的挑战与机遇。

人工智能:智能生活的新引擎人工智能(AI)作为当今科技界的明星,其影响力日益增强。根据最新报告显示,2023年全球AI市场规模预计将达到1100亿美元,年复合增长率超过20%。这一数字不仅反映了AI技

4天前

科技浪潮下的未来之光:人工智能的多维探索

怎样看待人工智能英语作文在当今这个信息爆炸的时代,人工智能(AI)如同一股不可阻挡的洪流,正悄然改变着我们的学习方式、工作模式乃至日常生活。它既是科技进步的象征,也是对未来无限憧憬的载体。当我们探讨“

4天前

智能家居的未来已来,你准备好了吗?

随着科技的飞速发展,智能家居已经不再是遥不可及的概念,而是逐渐渗透到我们的日常生活中。从智能音箱到智能灯泡,从智能冰箱到智能门锁,智能家居正以前所未有的速度改变着我们的生活方式。什么是智能家居?智能化

4天前

侯俊财教育背景

说起侯俊财,你可能不太熟悉这个名字,但他在农业科技领域的影响力可是不容小觑的。侯俊财毕业于中国农业大学,这所顶尖学府为他奠定了坚实的学术基础。之后,他又前往美国康奈尔大学深造,进一步拓宽了自己的视野和

4天前