云原生能力成熟度模型是一套用于评估企业在云原生能力方面成熟度的标准和框架。随着云计算技术的不断发展和普及,越来越多的企业意识到云原生技术对于提高业务敏捷性、灵活性和效率的重要性,因此对于云原生能力的评估和提升愈加重视。《云原生能力成熟度模型》已成为工信部发布的行业标准,并于今年4月正式实施。该标准由中国通信标准化协会发起,博云深度参与了技术架构模块的编写工作,围绕资源管理、运维保障、研发测试、应用服务等多个关键能力项,助力本标准在云原生技术架构成熟度评估和落地方面提供全栈技术能力参考和支持。

(关注博云公众号,后台发送“联系方式+邮箱+技术架构”,可索取标准全文)
IDC预测,到2025年,超过一半的中国500强企业将成为软件生产商,超过90%的应用程序将是云原生应用程序。由于采用了微服务、容器、动态编排和DevOps等技术,新增生产级云原生应用的比例将在2024年增加到60%。云原生已经走向大规模应用,在金融、能源、制造、政企、大模型训练等各个领域不断落地,从“架构上云”到“云上应用”,云原生的技术价值已被广泛认可,为企业提供高效用云路径,涌现出越来越多的应用实例。
对于企业和开发者而言,如何评估和衡量云原生的成效,通过成熟度模型和标准规范建设成为后企业上云时代关键技术演进和落地的重要一步。该标准的发布旨在解决企业在云原生转型过程中遇到的诊断难、规划难、建设难的“三难”问题。它为用户需求侧提供整体架构规划的标准参照,以解决实际问题为出发点,以行业技术发展的趋势为指引,帮助企业实现云原生化的快速和高效落地。当企业在设计业务系统架构时,可以以此为权威指南来应用云原生技术,并在建设路径方面提供更清晰直观的技术筛选路线,支撑架构的水平对比,方便更好地评估需求和供应商能力。
作为国内为数不多掌握底层核心技术并拥有十余年应用经验的厂商,博云科技荣幸受邀作为专家团成员,历时数月,深度参与了本次成熟度模型技术架构的编撰工作。该标准在技术水平上具有高度的行业先进性。博云在通过云原生成熟度模型咨询帮助传统企业加速转型的同时,也以自身多年的云原生落地案例,积极地参与和完善云原生技术标准体系,助力行业用户全面实现云原生转型的落地。
在未来的发展中,博云将充分利用其在容器、微服务、DevOps等核心技术方面的深厚积累,结合人工智能(AI)应用,走出一条独特的“人工智能+云原生”道路。博云计划进一步探索AI技术在大模型训练、算力管理等领域的创新应用,以帮助企业在云原生领域实现更高效的业务运营和更大的创新潜力。通过将AI技术与云原生技术深度融合,博云不仅能够提升自身的技术服务能力,还将为各行业的数字化转型提供更加智能、高效的解决方案,推动企业在业务创新和技术进步上迈向新的高度。博云致力于利用AI技术优化云原生架构,为企业提供前瞻性的技术支持和全方位的服务,助力企业在激烈的市场竞争中脱颖而出。
相关产品介绍
AIOS是博云专为AI应用推出的企业级一站式人工智能操作系统,屏蔽底层异构算力差异,面向大规模分布式计算,在计算、网络、存储、调度等基础能力全面增强,为AI应用提供稳定、高效、极简的底层支撑能力。同时AIOS支持主流的分布式AI深度学习框架,可满足算法、模型、组件的可视化开发,覆盖算法开发、数据管理、模型训练、在线推理的全生命周期。AIOS可以帮助企业和开发者自主构建人工智能业务,助力企业保持行业领先能力。

强大的底层掌控能力
AIOS的核心在于其强大的ACE算力引擎,支持高达5000个节点的稳定调度,以及异构GPU池化管理,确保了多租户算力的强隔离和全方位监控。
功能特性
覆盖深度学习业务全流程,加快模型从研发到上线速度
深度学习训练任务通常包含多个阶段,从数据处理、算法开发、模型训练、超参调整、模型管理与部署等,AIOS提供全流程支持。
快速部署计算环境并启动训练任务,提高研发效率
深度学习框架和模型众多,依赖各不相同,对开发环境的要求比较复杂, AIOS可以实现资源和工作环境的隔离及快速部署。
支持数据集统一管理,提升数据标注效率
数据集种类众多,数据标注工具不一。AIOS内置多种数据集标注工具,支持人工标注、协同标注、智能标注等多种业务场景,极大提升数据标注效率。
支持多种建模方式,方便算法工程师快速构建复杂模型
支持Jupyter交互式建模,方便算法工程师对代码进行调试;平台内置多种算法组件,支持通过拖拉拽方式实现可视化建模,极大降低建模门槛。
训练过程可视化,掌握训练进度及质量
深度学习模型训练周期较长,训练结束后才发现模型质量问题。借助AIOS,可以实现对训练过程实时监控并可视化训练过程,实时观测损失函数值的日志、训练误差或测试误差等。
动态分配 GPU 资源,充分利用资源,提高资源利用率
支持 GPU 资源细颗粒度调度能力,最低可划分1%资源。同时支持众多国产GPU算力。单一计算集群可以统一管理异构的多种GPU算力。
全面的集群监控管理,实时掌握 CPU/GPU 资源使用情况及运行状态
实时监控集群的使用情况,合理安排训练任务;及时发现运行中的问题,提高集群的可靠性。

方案优势概览
