网易云瀚海一体机,云计算“全栈”航母带来了什…

2018-09-10 00:55:40来源:中国云计算网 阅读 ()

新老客户大回馈,云服务器低至5折

近日,《计算机世界》专访了网易云基础设施技术总监、网易专业技术委员会委员张晓龙博士,解读当先热门的全栈云计算。据了解,在今年7月的云创大会上,网易云发布了单集群可支持5000物理节点的“瀚海”私有云、微服务解决方案“轻舟”、工业智能平台等最新产品,并联合浪潮推出首款云计算全栈一体机,引领了不少云计算厂商的跟进,全栈云成为今年云计算行业关注的焦点。

私有云迎来“航母模式”

融合了微服务与私有云,网易云让“一体机”进入了航母模式。那么这种组合模式是如何提出并实现的?网易云又是怎样让这艘航母起航的?对此,张晓龙表示,网易云最新发布的“轻舟”微服务、“瀚海”私有云以及云计算全栈一体机等产品,都是为了赋能企业数字化创新,支撑企业聚焦其业务本身而推出。

“轻舟”微服务是围绕应用和微服务打造的一站式PaaS 平台,能帮助用户解决应用从开发、测试、发布到上线运维等的全生命周期管理,并解决服务的注册,治理,链路跟踪,动态配置等问题,提供易接入,易运维的微服务解决方案。“轻舟”主要解决企业应用架构的问题,实现企业应用架构向微服务演进,其有两个显著特色:基于开源技术栈打造,兼容Spring Cloud,Dubbo和gRPC等开源微服务框架,能匹配各种服务框架,并且服务治理能力与业务解耦;轻舟支持DevOps工具链,实现高效自动化运维,使产品迭代速度大幅度提升。

“瀚海”私有云则是基于OpenStack、Kubernetes等开源标准架构全面优化的企业级私有云平台,提供与网易公有云同等的IaaS、PaaS、CaaS 服务,并可无缝接入网易公有云,享受公有云的开放性和资源弹性。“瀚海”主要全栈一体化解决企业业务研发所需的IT资源、平台通用服务以及研发/运维效率的问题,实现企业业务一站式上云,其有三个显著特色:全栈基于主流开源技术,如OpenStack、Kubernetes等;针对互联网业务做了大量优化,在稳定性/性能/功能/规模上具有互联网级IT的能力;在架构上与网易公有云保持一致且能不断演进升级,在用户体验上与公有云一致,同时能与公有云轻松组合成混合云。

张晓龙称:“轻舟顾名思义是轻快的小艇。一方面表示我们提供的是易用、低门槛的解决方案,另一方面也表示使用了“轻舟”微服务后能更轻,业务能跑得更快。瀚海顾名思义是广阔无延的大海。一方面表示我们为企业上云提供的是覆盖全面的解决方案,另一方面也表示我们的解决方案具有支撑能力大、性能强的特点。”

提供了“轻舟”和“瀚海”两个产品,网易云的全栈一体机就是用来落地这两个产品的一体化交付解决方案。不同于以往,第一代一体机,是把软件硬件打包在一起,解决的是快速交付的问题;超融合一体机,是资源层面的融合,主要是提升资源利用率,降低成本;全栈云计算一体机,是包含业务架构需要的所有云计算技术层次,解决的是业务研发效率问题,让客户只需要专注业务。

开放代表着云计算未来

在云创大会上,网易云发出自己的主张:“企业在数字化过程中必须考虑长远,保证系统平滑演进、自主可控和拥有可用的人才生态,而满足这三个要求,作为数字化基础的云计算必须是开放的。开放代表着云计算的未来”。

张晓龙指出,网易云一直是最坚定的站在技术开源、开放这条路上的。接纳开源技术以及开放/兼容平台接口标准,伴随了网易云的整个发展历程。

张晓龙回忆道:“2012年刚开始研发云平台时,当时OpenStack刚刚开源且尚未成熟完善,网易云在内部技术选型上也有过一些争议:到底是自研发一套IaaS云管理平台还是选择基于OpenStack研发?当时我们就认准了要走基于OpenStack开源技术的这条路,主要原因是我们认为,云计算发展很快,在开源社区肯定会出现一个主流的开源云管理平台,这个平台一定能吸引大量优秀工程师一起来快速完善。我们如果能基于OpenStack开源技术研发,第一,我们的云平台不用重复造一个轮子,可以实现短期内以较低成本减少好云平台的基本雏形;第二,我们能利用上全世界优秀工程师智慧快速完善我们的云平台;第三,我们的平台也更好招募优秀人才,从而保证平台的维护和完善后续能有更长的生命力。”

正如同张晓龙所言,网易云多年来一直坚持着最初的选择,还找到了志同道合的合作伙伴。

联合英特尔助力数字化经济发展

英特尔与网易云一样,在开源技术方面都持拥抱与支持投入的态度。双方认为开源对未来云计算和云服务发展将起到极大的推进作用。

这体现在开源能够汇聚行业精英的力量,以较低成本快速解决基础性的问题,然后在高级能力上做差异化竞争。此外,开源可以推动技术标准化并构建良好的生态,避免厂商锁定。

长久以来,网易云与英特尔一直保持着良好的战略合作关系。在技术上,双方的技术团队充分合作,针对英特尔推出的至强可扩展处理器、智能网卡、QAT以及Optane存储等硬件,结合软件定义技术开展深度性能优化,同时也在软硬件一体化设计上进行了深入的创新探索。

张晓龙表示:“我们合作的目的是一起联合打造高性能、低成本的云计算平台,推进云计算技术的进步,推动企业数字化创新,为产业升级赋能。在合作过程中,我们不但得到英特尔技术团队的全力支持,也体会到英特尔在硬件技术上的深厚实力,更深深感受到英特尔对软件技术特别是云计算开源软件技术的巨大投入。”

据了解,目前网易云服务了45万家企业,通过各类企业应用连接了超过8亿互联网用户。网易杭州研究院执行院长汪源称:“网易云已经成为一个巨大的互联网联接基础设施,在几乎所有企业都在数字化的当下,我们希望通过开放技术帮助到企业转型,促进数字经济的发展。”

为了提高云部署的速度与稳定性,英特尔IT部门为私有云增加了混合解决方案,包括OpenStack软件——一种可扩展的开源云操作环境。使用OpenStack,加上内部代码与现有的企业软件,英特尔IT部门部署了云基础设施,将数据中心解决方案转变为可快速获取的用户服务。


在2010年开始实施私有云时,英特尔IT部门的初期目标是提供简单的计算laaS,使用户能更加便捷获得服务器。为此,英特尔IT部门在整个环境中推行自动化,并使应用开发人员和应用所有者为应用环境快速部署基础设施。

基于2012年在早期的实际使用,英特尔IT部门在2013年计划转而使用更多的混合解决方案,以便让一部分容量运行在公有云和私有云中。甚至计划每3-6个月在企业私有云中实施混合云模式的模块与功能。使用外部云提供商可以让英特尔IT部门能够进一步提取部署的资源,根据成本、位置与监管要求,灵活确定计算与存储需求的来源。英特尔IT部门的目标是创建一种开放云,把公有云环境当做数据中心服务的扩展。这包括监控成本并使该环境看起来、运行起来都犹如基础设施的扩展,提供应用和数据的无缝用户体验。无论是内部或外部,最终用户需要随时随地通过任何设备轻松、安全地访问他们的应用与数据。

当一切都成为服务——计算、网络、存储和软件,API就成为云应用的构建模块与杠杆点。将应用拆分为单独的web服务,API可使应用的功能集成至其它的云应用并重复使用,同时为每个服务支持适当的扩展。设计良好的API还可提高相互操作,保护应用免受基础技术实施与供应商特定实施的影响。

这样做的主要动机在于英特尔IT部门洞察到业界对于企业IT的全新期待。让用户选择设备(IT消费化)的概念正席卷各个企业。习惯经由互联网获得服务的企业IT最终用户期待轻松获取应用、存储与连接,并快速接收更新。

新的实施计划扩展了选择面,并让思维不局限于当前的解决方案,能够寻求最灵活、可管理和高效的解决方案来满足自身需求。英特尔IT部门需要快速改变策略,将所有的数据中心解决方案作为用户服务提供,这对于多数运行未构建基础设施API的企业IT而言是一项庞大的工作。对英特尔IT部门而言,这意味着要为该解决方案打下坚实基础:网络结构的万兆以太网,所有全新的刀片服务器及存储节点的高密度双机架单元服务器。

目前,英特尔推出基于最新英特尔至强可扩展处理器的服务器。几乎所有组件都具备冗余以实现出色的弹性与高度稳定,但是整个系统也不会过度配置,以控制基础设施成本。

为了满足对用户服务的期待并实现对所有数据中心组件的自动化管理,英特尔IT部门将各种现成商用、开源和公有云解决方案作比较,评估了多家供应商的多种大规模云解决方案。最终认为,最适用于环境的解决方案是为当前环境增加OpenStack。OpenStack是一种开源软件栈,用于支持高度可扩展的基础设施。它提供一种开放、可扩展的框架,以管理laaS云中的各类资源,包括计算、网络和存储资源。英特尔IT部门的决定取决于OpenStack开发人员社区的优势、开发人员和管理员文档的质量和代码演进的速度。

使用开源软件的优势

企业IT可能会担心开源软件具有一定风险,例如:与通常配有专门支持团队解决技术问题的现有产品相比,可能不具备针对开源应用的技术支持;开发开源解决方案的社区最终可能背离公司的最大利益,或开源解决方案可能被大型公司收购;实施时间的自然增长,及最终超过现有解决方案的培训与再开发成本;担心不受控制的开源使任何人都可破坏代码。

然而,英特尔IT部门将开源软件用于设计网格(Design Grid)由来已久,并发现了如下优势:

强大而活跃的社区,众多第三方公司提供出色的支持服务。大量与英特尔规模相近或规模更大的公司实施或运行OpenStack,辅以他们自己的代码。OpenStack的广泛使用可确保特性与功能将继续反映企业的需求。

丰富的文档,包括管理指南、API文档和开发人员文档,可确保学习曲线较短。

对开源代码库的完全访问,包括严格的同行评审及整合各种代码之前的接受与回归测试。

频繁的更新周期——每6个月进行一次重要发布,可帮助快速实施最新的特性与功能,包括性能与效率改进。

在对开源软件OpenStack评估时,英特尔IT部门发现OpenStack不仅安全可靠,而且还可满足其它的大规模计算要求。另外,在从专有解决方案向开源解决方案转变时,还有一些令人瞩目的优势,包括:

能够实现相互操作、尽量减少厂商锁定并帮助达成混合云目标。开发团队可专注于更高价值的云功能领域,并通过与社区合作帮助开放式的云技术行业快速发展。

转变更快,成本更低。与实施私有云环境的基本要素相比,采用开源软件得以在开源社区中完成大量工作。因为其他企业IT也使用OpenStack,各企业IT便可一起编写必要的核心代码,无需单独编写后再在社区中分享。

减少提供计算laaS的时间,更多时间用以提供更高级别的服务领域。这可提供应用开发人员需要的更高级服务,提高最终用户的工作效率。

英特尔IT云平台解决方案堆栈

如图1所示,英特尔的全新云解决方案包括:

图1. 英特尔IT云平台解决方案堆栈图表,描述开源组件和其它组件及它们相关的更新周期。

界面层,包括图形用户界面(graphical user interface,简称GUI)、命令行界面(command line interface,简称CLI)及API(发布其所有的关键数据中心组件为用户使用的服务)。GUI和CLI的开发都给予API层。

具有配置管理数据库(配置和状态管理)管理层、观测器(事件监控)、决策器(基于规则的自动化决策者)、执行器(配置与状态执行)及采集器(用于运行时配置和目录的运行数据库)等组件。

具有基础组件的OpenStack云操作环境。

包括计算、存储和网络组件的物理基础设施。

为了将新基础设施和软件版本更新的影响降到最低,英特尔IT部门设计了支持定期升级的云平台,它可以更出色管理员工设备在IT基础设施和软件要求方面的快速变化。例如,每6个月发布新版的OpenStack,并预期其发布后的3个月内集成下一版本:Folsom。核心服务和对象存储的定期升级不会给最终用户造成宕机,是开放云运行模式中持续集成与演进这一核心理念的关键特性。

提高系统的稳定度和利用率

英特尔IT部门正致力于实现更高的系统稳定度,这是众多计划中的一个。目标是主要业务服务达到99.99%,这意味着一年中计划内与计划外的宕机时间不超过52分钟。这种水平的HA需要实施大量的自动修复。目前的系统稳定水平在99.7-99.95%区间波动,因应用不同而有所差异。

实现这一目标的一种途径就是采用活动/活动应用设计。如图2所示,在活动/活动实施过程中,两个或更多数据中心同时处于活动状态,每个数据中心都运行不同虚拟服务器上的常用应用。这些数据中心完全对称。在应用网络内,任何交易信息可发送至任何数据中心,再由后者读取或更新任何数据项组。


图2 在活动/活动应用设计中,两个或更多数据中心同时处于活动状态,在不同虚拟服务器上运行的常用应用以确保高度稳定。

活动/活动方法可提供最高灵活程度并最优化的系统投资,因为对于所有可用的处理容量而言,请求的负载保持均衡。如果一个数据中心发生故障,其它数据中心的用户不会受影响。另外,发生故障的数据中心的用户可快速切换至正常的数据中心,快速恢复他们的服务。在活动/活动模式中使用多个实例,可实现更高的性能、稳定度、利用率和灵活度。

英特尔IT部门计划添加更多复杂的使用案例。有必要借助能够对照动态模型进行根本原因分析的关联引擎改进决策器。例如,观测器和决策器可能会突然接收到大量针对一组应用服务器的告警。这由潜在的网络或存储故障造成,但决策器并未意识到这点,因而继续在该组应用服务器上进行适当的操作。通过借助功能更强的关联与分析引擎(能够理解它接收到的消息的上下文)改进的决策器,能帮助它做出更明智的决定。

提高服务水平与符合规范

和许多企业IT一样,英特尔IT部门向大量企业技术作投资,从服务管理工具到身份验证和授权工具。使用开源基础设施的一大主要目标就是了解它与企业使用的现有解决方案的整合效果到底有多出色,如服务管理系统。与服务管理系统的整合至关重要,尤其是正在转变为完全的信息技术信息库环境。

根据架构与设计目标,系统需要提供用于追踪服务水平与符合规范的必要数据。配置采用管理系统,加上监控系统与关联引擎,可帮助在供应时间与资源关联。然后,该信息被提供给消息总线,并导入服务管理工具。

观测器也会在供应时间获得该信息,以确保资源被立即监控及资源告警可通过消息总线再次被服务管理工具轻松捕获,从而支持快速、独立的自动修复,例外情况只要求操作人员接收事故清单以进行问题管理。

利用消息总线模型和发布与订阅方法,该设计可极其灵活地识别和记录引起告警的原因、引起自动修复起因和生成用于操作人员故障分析的清单。

全新的英特尔IT云平台解决方案堆栈可以提高资源管理与其它优化的自动化水平,帮助企业IT向联合的、相互操作和开放云的目标迈进重要的一步。它使得在设计核心laaS解决方案上所花的时间减少,将其用于更高水平的服务领域,以提供更佳的服务,让应用开发人员使用它们来构建可提高最终用户工作效率的应用。

英特尔将继续使用可提供最佳解决方案并契合云演进的商用软件,而OpenStack可提供多功能工具,支持构建用于管理和提供各种资源(如云中的计算、网络和存储资源)的开放式可扩展框架。

短期来看,英特尔预计将继续改进所有层面的云平台。下一步的关注重点包括协调、块存储、自动扩展策略、实时迁移和复杂的应用部署。英特尔还计划继续向混合解决方案演进,使得能够更轻松地使用公有云服务。

标签:

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有

上一篇:网络安全事件频发, “云安全”成企业安全配置刚需

下一篇:云安全形势复杂,安全服务市场大