运维
导语:本文将探讨某新能源车企如何借助腾讯云可观测平台,实施可观测性方案,从而缓解运维焦虑,实现更高效的系统管理。 雷畅 腾讯高级工程师/腾讯云可观测方案架构师。具有多年可观测领域研发经验,对业务端到端监控有深刻理解。 案例背景 在新能源汽车行业的快速发展中,企业面临着日益复杂的运维挑战。可观测性技术


蓝鲸智云作业平台,以下简称作业平台或JOB平台 作业模板和执行方案:将运维操作场景中涉及到的多个脚本执行或文件分发步骤组合成一个作业模板,这个作业模板尽可能把场景相关的共性逻辑都包含进去,然后再根据实际使用场景衍生出相应的执行方案,作业模板和执行方案的关系为 “一对多” 如何创建及使用作业模板? 使


本文来自腾讯蓝鲸智云社区用户: CanWay 数字化转型与可观测的关系 在数字化转型的浪潮中,我们面临着将“线下业务线上化”及实现“业务快速创新迭代”的迫切需求,这也进而要求支撑业务的应用系统更加敏捷、可扩展性更高。 因而,分布式、云原生是企业应用架构的发展方向。 分布式架构下,各种IT对象如消息队


蓝鲸智云作业平台,以下简称作业平台或JOB平台 JOB消息通知功能简介: ● 消息通知设置功能帮助用户更及时的掌握任务的执行状态,支持根据不同的任务类型选择不同的通知方式给到指定的通知对象。 ● 需要提前配置好消息通道,才可使用该功能。 ● 值得注意的是:通知对象的人员选择受全局设置中的通讯黑名单限


本文来自腾讯蓝鲸智云社区用户: CanWay 大多数组织中都实施了变更管理,但是效果参差不齐,尤其在变更管理的核心环节,部分组织因缺乏有效的把控,使得变更管理的效果不尽人意,甚至可能面临失控的风险。为此,我们有必要深入探讨并详细分析变更管理中的关键活动,并通过实例加以说明。 变更模型与适用场景 变更


本文来自腾讯蓝鲸智云社区用户: CanWay 在IT服务管理中,流程的落地和执行至关重要。请求管理作为ITSM的重要组成部分,直接影响到组织内部的服务交付和用户满意度。为了确保请求管理流程的高效性和规范性,我们不仅需要清晰地区分不同类型的请求,还需要优化请求的履行工作流程。本文将分享一些在ITSM流


轻量云 Meetup 武汉站 轻云之上,樱为有你 樱为有你 3月15日,武汉的樱花初绽,东湖畔的微风裹挟着淡淡花香,而比春光更动人的是轻量云Meetup武汉站的氛围。在这个充满诗意的季节,我们与众多轻友相约江城,以技术为笔,以云为纸,共同书写了一场关于无限可能的春日篇章。 樱花树下的相聚,让这次Me


本文来自腾讯蓝鲸智云社区用户: CanWay 指标指用于描述一个物体或事物的某个性质的指数、规格、标准,使其可以和其他的物体或者事物比较;从软件的角度讲度量即把所有东西都量化、数据化、可采集。指标即表示对这些量化后的数据的目标值。 观测指标体系是指对监控指标进行体系化的规划、实现全生命周期管理、建设


本文共计1368字 预计阅读时长5分钟 2025年4月10-12日,全球软件开发大会(Global Software Development Conference)在北京盛大召开,来自全球50+国家的3000+技术领袖、企业CIO及开发者齐聚一堂,共探“大模型正在重新定义软件”的技术革新。作为L


背景 在人工智能(AI)蓬勃发展的当下,图形处理单元(GPU)凭借其强大的并行计算能力,成为了 AI 训练和推理工作负载的核心驱动力。从大规模的深度学习模型训练到实时的图像识别和自然语言处理任务,GPU 的高效运行直接决定了 AI 应用的性能和效率。 无论是追求极致的 AI 训练效率,还是保障科学计


导语 本文介绍了微众银行在TDSQL存算分离架构方面的探索实践。文章首先回顾了微众银行作为首家数字银行采用分布式架构的创新历程,然后阐述了其基于TDSQL的同城多活架构体系。随着数据规模增长,原有存算一体架构面临业务连续性、资源利用和扩展性等挑战,促使微众银行进行存算分离架构革新。文章重点分析了这一


一、告警功能整体介绍 在数字化时代,系统故障和异常随时可能引发连锁反应,因此告警的重要性不言而喻。腾讯云监控告警平台作为腾讯云可观测平台的重要组成部分,是承载着云产品监控、APM 监控、RUM 监控、云拨测监控等 6 种类型的统一告警平台,后续也将进行更多类型的监控覆盖。在云监控统一告警平台内,支持


本文来自腾讯蓝鲸智云社区用户: CanWay 告警在运维体系中的必要性 企业监控告警管理的困扰 告警管理是企业运维管理中的一个重要环节,它可以帮助企业实时监测和诊断业务系统的状态,并及时发现可能存在的故障或异常情况。但是,在实际操作中,企业告警管理也面临一些困扰,主要包括以下几个方面: 告警散落不标


本文来自腾讯蓝鲸智云社区用户: CanWay 何为排障“最后一公里” 为什么说在企业运维排障中,日志体系建设通常被称为"最后一公里"? 这是因为日志是在系统出现问题时提供关键信息的重要数据来源。在排障过程中,日志记录了系统运行时的各种活动和事件,可以帮助运维人员追踪问题的根源。 “最后一公里”指的是


引言 在教育行业数字化转型进程中,某教育头部客户的运维团队面临自建 SkyWalking 监控系统的严峻挑战。随着业务规模扩张,系统运维复杂度呈指数级增长,运维团队每月 20% 以上工作时间都消耗在监控系统自身故障处理且微服务架构下的故障排查效率极低 ,针对这一现状,该团队通过技术架构升级与优化

