编者按:
在突然降临的后VMware时代,以高端制造业为代表的智能制造行业如何在短时间内平稳实现核心系统虚拟化技术平台的替换,成为了业界广泛关注的焦点。为此,twt社区及时组织了一场以“高端制造行业生产关键应用VMware虚拟化平替难点及实践”为主题的交流分享活动。
活动中,与会者深入探讨了企业在技术平台替换过程中需要重点关注的技术指标和替代路线选型方法,为行业提供了宝贵的参考。活动特别邀请了制造企业专家,结合自身实践经验分享企业在VMware替代项目中的切实心得和恳切建议。不仅为与会者提供了真实案例参考,还从技术选型、迁移实施到风险应对等多个维度,为行业提供了可借鉴的方法论。此次交流活动为高端制造行业在虚拟化平替过程中面临的挑战提供了切实可行的解决方案,助力企业实现平稳过渡和业务连续性保障。
本文整理了活动中几位专家的宝贵分享以及众多制造业同行的热烈讨论,特别是经过交流达成的同行共识总结,以供更多同业参考。
2024年,随着博通收购VMware事件的持续发酵,大量企业在虚拟化平台的选择上迎来了严峻的考验和调整需求。这一考验主要源于以下几方面的变化:
1. 产品定价与许可政策的变化
博通收购VMware后,新的定价和许可模式导致虚拟化成本大幅上升,给企业带来了巨大的经济压力。尤其是对VMware装机量较大的企业而言,这一问题尤为突出。许多企业不得不重新评估其虚拟化策略,以应对不断攀升的运营成本。
2. 技术支持和服务的变化
博通的收购可能带来VMware产品支持服务的变更,例如技术支持质量下降或客户沟通效率降低。这种不确定性直接影响了企业的运维体验和业务连续性,使得企业不得不考虑其他替代方案,以确保技术支持的稳定性和可靠性。
3. 地域性安全变化
随着国际形势的复杂化,进口软件及公司的不确定性增加,中国企业需要提前规划可靠的备用方案,以避免在突发情况下措手不及并被迫承担高昂的转换成本。地域性安全问题不仅涉及技术层面,还关系到企业的长期战略规划和数据安全。
以高端制造业为代表的智能制造行业,普遍存在VMware装机量大、传统架构系统多等特点,这使得他们在虚拟化平台替换过程中面临更大的挑战。这些企业通常拥有复杂的生产环境和关键业务系统,对虚拟化平台的稳定性、性能和兼容性要求极高。因此,如何在短时间内实现平稳过渡,成为他们亟需解决的问题。
针对这一急迫需求,twt社区组织了“高端制造行业生产关键应用VMware虚拟化平替难点及实践”的交流分享活动。聚焦于制造行业关键生产应用在VMware虚拟化平台替代过程中的核心问题,通过深入的理论分析、详实的案例分享以及丰富的实践经验总结,为企业从VMware迁移至替代虚拟平台提供了全方位的指导与支持。不仅为企业提供了科学评估与选型的方法,还为迁移过程中的平稳过渡以及后续高效稳定的长期运维构建了系统化的方法论和实践参考,助力企业核心系统实现无缝迁移与平稳运行。
1. 产品选型难点及推荐方法
多维度评估指标:在产品选型中需关注功能性、性能表现、兼容性、安全性、成本效益等多方面的综合评价,避免片面关注某一特性而忽视整体需求。 行业经验借鉴:参考同行企业选型经验,分析实际应用效果,有助于快速明确需求并缩小选型范围。 高效选型办法:对于人力和资源有限的企业,建议通过小规模测试、概念验证(POC)和行业技术交流、借鉴社区资源(如TWT)来高效完成选型。 重点考察厂商能力:选型需关注厂商的技术支持能力、长期发展潜力和生态建设,以确保方案的长期适用性和支持力度。
迁移规划与测试:在迁移实施前,需对业务依赖关系和优先级进行详细分析,并在测试环境中进行多次模拟迁移,确保万无一失。 分阶段迁移策略:建议先迁移非核心业务,验证稳定性和性能后,再逐步迁移关键业务,以降低整体风险。 业务连续性保障:制定详细的迁移计划和回滚方案,确保在迁移过程中出现问题时可快速恢复原有状态,减少业务中断风险。 多方协作保障成功:迁移需要基础设施团队与业务团队紧密协作,从技术到业务架构全面保障平稳过渡。
硬件兼容性问题:选择兼容新老硬件的替代方案,尤其是对CPU代际兼容性和存储方案的适配能力有明确需求,要求厂商提供兼容性清单供参考。 API接口支持:替代方案需提供稳定、易用且符合现有集成标准的API接口,适当评估此处工作带来的成本和工作量。 生态建设与持续投入:需要考察替代产品的厂商在研发投入、市场装机规模和长期生态建设方面的能力,确保产品迭代稳定且技术支持可靠。 自动化迁移与运维工具:优选提供自动化迁移工具的方案,以简化迁移流程并保障项目进度,同时提升长期运维效率。
活动中的实践分享如下:
高端制造行业VMware虚拟化如何平稳替换确保关键生产系统稳定运行——同行分享
本次活动邀请了某制造企业的系统架构师孙伟华、某汽车集团数字化中心的云平台主任工程师胡博、深信服的云计算产品运营总监何啸铖作为活动的分享嘉宾,某车企的主机平台经理应步青作为主持人。他们向大家分享了关于替换VMware虚拟化的路线选择、平替选型、替换方法等核心问题的实践和思考。
首先,主持人应步青老师为我们详细解读并分享给社区会员《VMware虚拟化平替选型框架》。他针对框架中提出的关键评估指标逐一进行了深入评析,包括功能性、性能表现、兼容性、易用性、安全性、成本效益等多个维度。应老师特别强调了这些指标在实际产品选型中的重要性,指出它们能够帮助企业全面、系统地评估替代方案,避免因片面关注某一特性而忽略整体需求。此外,应老师充分肯定了这份框架文件在实际产品选型中的积极作用,认为它为行业提供了一个标准化、可操作的评估工具,极具参考价值。他呼吁社区会员共同参与框架的丰富和完善,通过分享实际项目经验和反馈,进一步优化评估指标和方法,使其能够更好地服务于更多企业,帮助大家在虚拟化平替过程中做出更科学、更合理的决策。通过应老师的解读,与会者对《虚拟化平替选型框架》有了更深刻的理解,也为后续的讨论和实践奠定了坚实的基础。
随后,某制造企业的孙伟华老师分享了企业在VMware虚拟化平替过程中的难点及实践心得。孙老师详细回顾了所在企业从物理机到虚拟机,再到VMware替代产品的技术变迁历程,涵盖了计算虚拟化、网络虚拟化、桌面虚拟化和存储虚拟化等多个阶段。他深入介绍了国产平台替代VMware的具体过程,包括产品架构对比、虚拟机集群的规模设计、容错度设计、超分比设计等关键技术环节,为与会者提供了宝贵的实践经验。在分享中,孙老师特别提到规划迁移中遇到的特殊问题,例如USB key的兼容性挑战,并分享了相应的解决方案。他还总结了企业在实际迁移中面临的主要挑战,例如硬件兼容性、数据迁移风险以及业务连续性保障等,并提出了分类讨论、充分评估、最小化改动的应对策略。孙老师强调,在总体成本评估时,除了直接的技术投入外,还需要考虑生态兼容性和人员适配性等因素,这些隐性成本往往对项目的成功起到关键作用。孙老师的分享为与会者提供了一个真实、具体的案例,证明了在充分评估和审慎实施的前提下,企业完全能够实现VMware替代的平稳迁移和成本可控的目标。他的经验不仅为其他企业提供了可借鉴的方法论,也增强了行业对国产虚拟化平台替代VMware的信心。
活动中的交流探讨节选如下:
高端制造行业VMware虚拟化如何平稳替换确保关键生产系统稳定运行——核心探讨议题
在随后的核心议题探讨中,用户围绕替代VMware虚拟化平台提出了多方面的关注点和担忧,主要集中在技术兼容性与业务连续性、平台管理与运维能力以及迁移实施与选型测试等维度。用户特别关注如何保障业务连续性,以及新老硬件的兼容性、存储方案的适配性、CPU代际兼容性和历史遗留系统的处理办法,这些问题直接关系到迁移过程中业务的稳定性和系统的平滑过渡。同时,用户对统一平台管理、集群管理水平、配置便利性、使用习惯一致性以及故障诊断功能的完整性提出了具体需求,反映了对新平台在运维效率和操作体验上的期望。此外,用户还关注迁移项目的规划方法、技术路线的选择策略,以及如何高效且完备地进行选型测试,体现了对迁移过程科学性和可操作性的重视。针对这些问题,与会的专家老师逐一进行了详细的技术解答,提供了切实可行的解决方案,以下是精彩问答节选:
【核心共识交流议题一】关键生产系统环境替换VMware平台有哪些可选择的技术路线?应该如何选?
问题1:某生物科技企业用户提问:在选型过程中,甲方往往面临人力和资源有限的问题,难以投入大量时间进行详细的测试和评估。同时,市场上检索到的资料通常偏向于“大而美”的宣传,缺乏实际应用场景的客观分析。这种情况下,如何高效、精准地完成选型工作,选择出最适合自身需求的品牌和方案,成为甲方的核心挑战。此外,甲方还需要在有限资源内平衡成本、技术成熟度、售后服务等多方面因素,确保选型结果既能满足当前需求,又具备长期可持续性。针对这些问题,是否有系统化的方法或工具,能够帮助甲方在资源有限的情况下,快速筛选出最优方案,并避免选型过程中的常见误区?
主持人应步青:针对甲方缺乏人力和资源参与选型测试的情况,可以通过借鉴同行经验、利用专业资源和简化流程来高效完成选型工作。首先,参考同行业其他公司的选型方案,尤其是规模与需求相似的企业,分析他们的选择逻辑和实际应用效果,能够帮助甲方快速明确自身需求并缩小选型范围。其次,借助像twt这样的技术社区或行业报告,获取选型参考模型或市场分析,了解主流品牌的优劣势,避免被大而美的宣传误导。此外,参加行业峰会或交流活动,与同行直接沟通并获取第一手使用反馈,同时观察厂商展示的最新解决方案,也是一种高效的选型方式。在测试环节,甲方可以聚焦核心需求,通过小规模测试或与厂商协商试用版、概念验证(POC)来节省资源。如果条件允许,还可以借助第三方咨询公司的专业能力,获得更客观的评估结果。最后,选型时需重点关注厂商的售后服务能力和方案的可持续性,确保长期支持与迭代更新。通过以上方法,甲方能够在资源有限的情况下,高效、精准地完成选型工作,选择出最适合自身需求的品牌和方案。
问题2:某钢铁集团用户提问:平替VMware的vCenter及vSAN等统一管理功能时,新平台在分布式交换机、分布式存储、集群管理等核心功能上的对标能力是运维人员关注的重点。对于已经熟悉VMware的工程师来说,新平台的操作界面和UI设计差异是否会影响其使用效率?在功能实现上,新平台是否能够完全覆盖VMware的核心能力,尤其是在高可用性、性能稳定性和管理便捷性方面?此外,新平台的学习成本和适应周期是否会成为运维团队接受的障碍?如何在保证功能对标的同时,进一步提升操作体验和本地化支持,以获得运维人员的认可?
嘉宾孙伟华:就我们选型的产品来说,这些产品在功能上的差异其实并不大,主要是一些操作界面和UI图形化的区别,实际上核心功能基本上是一致的。比如分布式交换机、分布式存储、集群管理这些关键能力,新平台都能够很好地实现,并且在性能表现上也能够满足日常运维的需求。对于已经比较熟悉VMware的工程师和技术人员来说,他们能够比较快地适应现在大部分产品的操作差异,因为底层逻辑和功能实现方式并没有本质上的变化。当然,新平台在操作体验上可能会有一些学习曲线,比如界面布局、功能入口的设计等,但这些都可以通过短期的培训和实际操作来克服。从我们的经验来看,只要新平台能够提供稳定的性能和直观的操作体验,运维人员的接受度还是比较高的。此外,新平台在成本优化和本地化支持方面的优势,也会成为获得认可的重要因素。总的来说,只要功能对标到位,并且注重用户体验,新平台是完全能够获得运维人员认可的
问题3:某智能汽车企业用户提问:在替换VMware平台的过程中,针对关键生产系统环境,有哪些可选的技术路线?应该如何选择最适合的方案?此外,新平台是否支持与现有硬件、操作系统和第三方系统的无缝集成,以及是否具备完善的API接口和自动化运维工具,也是我们评估的重点。在选择技术路线时,是否需要考虑分阶段迁移策略,先迁移非核心业务,再逐步过渡到核心生产系统?
主持人应步青:有三条主要技术路线,并分析了各自的优缺点。第一条是进口路线,包括微软、红帽等厂商的解决方案,但这些路线面临一定的风险,例如部分厂商正在退出市场、价格上涨或未来不确定性较高。第二条是云原生路线,适用于新建应用,但对于遗留系统较多的企业来说,改造量大、周期长,短期内难以实现,尤其对体量大的公司挑战更大。第三条是平替路线,分为两种:一种是纯计算资源替代,例如深信服等虚拟化平台直接替代VMware的计算虚拟化功能;另一种是超融合替代,适用于原有超融合架构的企业。如果企业原有资产并非超融合架构,直接采用新的超融合解决方案可能导致资产回报率损失,因此更推荐采用完全平替方案。此外,应老师强调,选择技术路线时还需综合考虑性价比、原有架构和资产利用率等因素。最后,建议企业根据自身实际情况进行深入分析和选择。
嘉宾孙伟华:在替换VMware平台的过程中,我们与应步青老师的看法有许多相似之处。首先,我们曾考察过一些海外产品,但基于安全性和未来发展的研判,最终将其排除在外。剩下的选择主要集中在平替路线和自建云方案上。自建云虽然是一个方向,但周期较长且需要解决的问题较多,因此在短期内,我们更倾向于选择成熟的虚拟化产品进行平替。无论是超融合产品还是计算虚拟化软件,本质上都是提供虚拟化资源,只是形式不同(HCI或纯计算虚拟化)。我们在选型时更关注厂商的企业规模、客户案例以及技术细节的匹配度。经过综合评估,像深信服这样的国产厂商成为我们的优先选择,因为其在市场上较为成熟且具备丰富的实践经验。此外,我们也考虑了一些基于KVM开源技术的软硬件搭配方案,但这些方案的能力和长期适用性仍需进一步商榷。如果时间线拉得更长,我们可能会更深入地评估这些方案的潜力。总的来说,短期内我们更倾向于选择成熟的国产虚拟化产品,以确保平稳过渡和业务连续性。
【核心共识交流议题二】平替VMware实施过程中会遇到哪些难点?
问题1:某高端厨电制造企业用户提问:我们现在在考虑替换VMware平台,但有一个很实际的问题:目前市面上有没有哪个平台能像VMware一样做到新老硬件的广泛兼容?比如,VMware既能支持分布式存储,也能利用集中式存储,而很多新平台似乎只能支持分布式存储。另外,VMware对CPU的兼容性也很强,从老到新的几代都能支持,但有些平台好像只能兼容较新的CPU。我们这样的公司都有一些老旧的服务器还在使用,如果新平台不能兼容这些硬件,可能会带来不小的成本压力。所以想了解一下,有没有哪个替换平台能在硬件兼容性上做到和VMware类似的程度?如果有,具体能支持到什么年代的CPU?有没有相关的兼容性清单可以参考?
嘉宾何啸铖:深信服的解决方案在硬件兼容性方面做了大量优化,能够支持现在各类主流国内外近5代以上CPU,这已经覆盖了大多数企业现役的服务器设备。一般来说,服务器的使用周期至多在8到9年,后续就不可能再有服务了,因此这一兼容范围能够满足绝大多数场景的需求。对于过于陈旧的服务器,我们建议谨慎使用,因为这些设备可能存在较高的故障风险,反而会影响整体系统的稳定性。在存储方面,深信服的解决方案不仅支持分布式存储,还能够兼容集中式存储,为用户提供更灵活的选择。此外,我们在软件层面也提供了详细的兼容性清单,涵盖硬件、操作系统等多个维度,用户可以根据清单明确了解适配情况,确保平滑过渡和稳定运行。
问题2:某钢铁制造企业和某高端厨电制造企业提问:在替换VMware的过程中,最关键的问题是如何保证业务不中断,尤其是如何实现完全不影响生产的热迁移?我们目前的生产环境对业务连续性要求非常高,任何停机或性能波动都可能对生产造成重大影响。因此,我们希望了解在迁移过程中,是否有成熟的技术方案能够确保虚拟机(VM)在迁移时无需停机?同时,如何保证数据的一致性和完整性,避免迁移过程中出现数据丢失或损坏?最后,如果迁移过程中出现问题,是否有快速回滚的机制,能够将系统恢复到原有状态,从而最大限度地降低风险?
嘉宾胡博:我们的汽车集团经历过多次基础设施的迁移,积累了一些关键经验。正如深信服的老师提到的,迁移项目的初始阶段需要对业务进行详尽的分析,明确每个业务系统的依赖关系和优先级,然后逐个设计相应的迁移方案。这是确保迁移成功的基础。然而,想要完全保证业务不中断,仅仅依靠基础设施的迁移策略是不够的,业务架构的设计也至关重要。业务系统需要具备一定的弹性和容错能力,例如支持分布式部署、负载均衡和故障自动切换等特性。只有这样,才能在迁移过程中最小化对业务的影响。此外,迁移前的测试和验证环节必不可少。我们通常会搭建与生产环境高度一致的测试环境,进行多次模拟迁移,确保每个环节都万无一失。同时,制定详细的回滚计划也是关键,以便在出现问题时能够快速恢复,最大限度降低风险。总之,成功的迁移需要基础设施团队和业务团队的紧密协作,从技术到架构全方位保障,才能实现平滑过渡和业务零中断的目标。
嘉宾何啸铖:从技术层面来说,确实没有100%的方法能够保证业务完全不中断。我们只能通过周密的规划和设计,尽量接近“零中断”的目标。因此,在迁移过程中,与业务团队的紧密协作至关重要。首先,需要与业务方充分沟通,明确每个系统的关键性和可容忍的停机时间(down time),并据此制定详细的迁移计划。其次,必须设计完善的应急处理方案,包括如何快速回退到原有状态。迁移过程中可能会遇到各种特殊场景,例如硬件兼容性问题、网络配置异常或数据同步失败等,因此回退机制是保障业务连续性的最后一道防线。此外,迁移前的测试和验证环节不可或缺。通过模拟迁移,可以发现潜在问题并提前解决,从而降低实际迁移中的风险。同时,建议采用分阶段迁移策略,先迁移非核心业务,验证稳定性和性能,再逐步迁移核心业务。总之,虽然无法完全避免中断,但通过精细化的设计、充分的测试和应急准备,可以将中断时间和影响降到最低,确保迁移过程的平稳和业务的连续性。
问题3:某智能电动汽车企业用户提问:在替代VMware虚拟化平台的过程中,我们特别关注如何实现无缝迁移,确保业务在迁移过程中不中断或不受影响。此外,新平台的第三方API接口能力也是我们关注的重点,因为我们的业务系统高度依赖与外部系统的集成,API的兼容性和功能性直接关系到业务的连续性和开发效率。我们希望了解,新平台是否能够提供与VMware相媲美甚至更优的API支持,包括接口的稳定性、易用性以及是否支持现有的集成标准。同时,迁移过程中如何保证数据的一致性和完整性,以及是否能够提供自动化迁移工具来简化流程,也是我们亟需解决的问题。
嘉宾胡博:关于无缝迁移的问题,其实与之前讨论的第一个问题类似,这里就不再赘述。针对第三方系统API的集成问题,我结合我们的经验分享一下。虽然VMware提供了丰富的API接口供其他平台接入和管理,但在我们内部,直接通过vCenter进行集成的系统并不多。我们主要利用其资源开通和释放的能力,如果只是适配这几个接口,工作量相对较小。在自动化运维方面,我们更多依赖于OS层面的操作,通过自动化脚本和直接向OS层发送管理命令来实现。对于现存的虚拟机管理,我们主要依赖虚拟化平台自身的功能,例如故障迁移、快照等,而不是大量使用vCenter的API。这种做法简化了集成复杂度,同时也降低了维护成本。总的来说,我们的经验表明,在API集成方面,可以根据实际需求选择性地使用虚拟化平台提供的功能,而不必过度依赖复杂的API接口,这有助于提高运维效率和系统稳定性。
欢迎点击文末阅读原文到社区阅读和讨论交流,发表您的看法 觉得本文有用,请转发或点击在看,让更多同行看到
资料/文章推荐:
欢迎关注社区以下 “虚拟化”技术主题 ,将会不断更新优质资料、文章。地址:http://www.talkwithtrend.com/Topic/23
*本公众号所发布内容仅代表作者观点,不代表社区立场