周昕毅:携程应用和服务主要通过框架 SDK 埋点的方式记录 Metric、Logging、Tracing 数据,除应用之外,操作系统、硬件、安全、网络设备等的监控 Metric、日志 Logging 数据均是通过携程自研的 Hickwall Agent 进行统一采集上报到存储系统和消息队列进行后续的统一处理。 统一监控 Agent 采集的主要对象包括:系统级监控指标:CPU...
三个月后,携程便被IDG看上了,估价被提到200万美元,IDG决定投入第一笔风险资金50万美元;2000年3月,携程吸引以软银集团为首的450万美元的第二轮融资;2000年11月引来美国凯雷集团1100万美元的第三笔投资;2001年10月,携程首次宣布盈利后便开始了纳斯达克之旅,两年后携程成功登陆纳斯达克,并成为了中国最大的在线旅游服...
周昕毅强调,通过统一的Agent,携程能够集中管理监控策略,降低分散管理带来的复杂性,并有效提升数据的安全性和合规性。 AI驱动的AIOps实践面对日益复杂的技术架构,携程在AIOps领域也进行了前沿实践。通过智能化的监控、自动化告警和故障检测,携程有效地应对了系统的动态变化和瓶颈问题。未来,携程计划在统一的可观测平台上进...
周昕毅强调,运维人员在面对如此庞大的数据量时,往往难以从中提炼出有价值的信息,导致关键问题被掩盖,从而延长了故障排查的时间。此外,平台可能面临性能瓶颈,处理海量数据需要高效的基础设施,而不当的治理更会提升运维成本,这些都是目前携程可观测平台面临的最突出问题。 为了解决这些挑战,携程采取了一系列创新措施,包括数...
在周昕毅的分享中,他强调了数据治理的关键在于如何平衡系统性能与资源消耗。为此,携程采用了多种技术手段,如数据采样和聚合策略,通过这些手段显著减少不必要的存储和计算负担。此外,实施冷热数据分层存储机制,将频繁访问的数据与不常访问的数据进行合理存储,也是一项有效策略。
周昕毅,携程云原生研发总监,分享了携程在可观测性升级中采用的多项技术措施。这些措施包括数据采样、分层存储与统一监控Agent等关键技术,旨在高效处理日益增加的监控和日志数据。他指出,传统的监控手段在面对庞大数据量时显得无能为力,新的架构需要在保障系统性能与成本控制之间找到平衡。
在此大环境下,携程,作为全球领先的在线旅游服务平台,面临着激增的监控数据与日志处理需求,这不仅挑战了其数据治理的效率,也对系统性能与成本之间的平衡提出了更高的要求。近期,在即将召开的QCon上海站上,携程云原生研发总监周昕毅将分享其在《AI驱动下的可观测平台架构升级实践》中所采用的创新解决方案。
在此过程中,携程对监控数据进行了智能化治理,自动识别并封禁非法写入。周昕毅指出,通过这种方式,可以确保监控数据的准确性和完整性,从而降低误报率,提升监控的可靠性。基于这样的管理策略,携程的可观测性平台不仅在数据质量上得到了保证,也在系统性能上实现了显著提升。
在即将召开的QCon全球软件开发大会上,携程的云原生研发总监周昕毅将分享《AI驱动下的可观测平台架构升级实践》。在会前的采访中,他深入探讨了携程在应对这些挑战时所采用的创新解决方案,尤其是在数据采样、分层存储和统一监控Agent等技术手段上的应用。 可观测性的挑战与应对携程的可观测平台正在快速发展。然而,数据量的...