目录
3. 修改 Spring Boot 应用程序以包含 SkyWalking Agent
Apache SkyWalking 简介
Apache SkyWalking 是一个开源的观测性分析平台,主要用于分布式系统的应用性能管理(APM)和可观测性(Observability)。它提供了全面的监控、追踪、诊断和可视化功能,帮助开发者和运维人员实时了解应用程序的运行状态,快速定位和解决问题。SkyWalking 由阿里巴巴贡献给 Apache 基金会,并于 2018 年成为 Apache 的顶级项目。
主要功能
-
分布式追踪(Distributed Tracing):
-
SkyWalking 支持分布式追踪,能够跟踪跨多个服务的请求链路,帮助用户理解请求在不同服务之间的流转情况。
-
通过追踪每个请求的调用路径,用户可以识别性能瓶颈、异常调用和依赖关系。
-
支持 OpenTracing 和 OpenTelemetry 标准,方便与其他系统集成。
-
-
指标监控(Metrics Monitoring):
-
SkyWalking 提供了丰富的指标监控功能,包括 CPU 使用率、内存使用率、响应时间、吞吐量、错误率等。
-
用户可以通过仪表盘实时查看应用的健康状况,及时发现潜在问题。
-
支持自定义指标,用户可以根据业务需求添加特定的监控项。
-
-
服务拓扑图(Service Topology):
-
SkyWalking 自动生成服务之间的调用关系图,展示服务间的依赖关系和调用链路。
-
通过拓扑图,用户可以直观地了解系统的架构和各个服务的交互情况,便于进行故障排查和性能优化。
-
拓扑图支持动态更新,实时反映系统的变化。
-
-
日志关联(Log Correlation):
-
SkyWalking 可以将日志与追踪数据关联起来,帮助用户在出现问题时快速定位相关的日志记录。
-
通过点击追踪链路上的某个节点,用户可以直接查看该节点的日志,简化了问题排查的过程。
-
支持与多种日志系统集成,如 Elasticsearch、Loki 等。
-
-
告警和通知(Alerting and Notifications):
-
SkyWalking 提供了基于规则的告警功能,用户可以设置阈值,当监控指标超过设定的范围时触发告警。
-
支持多种通知渠道,如电子邮件、Slack、PagerDuty、Webhook 等,确保问题及时得到处理。
-
告警规则可以灵活配置,用户可以根据不同的场景设置不同的告警条件。
-
-
UI 和可视化(User Interface and Visualization):
-
SkyWalking 提供了一个直观的 Web 界面,用户可以通过仪表盘查看各种监控数据、追踪链路和服务拓扑图。
-
支持自定义仪表盘,用户可以根据自己的需求创建个性化的视图。
-
UI 设计简洁易用,用户无需复杂的培训即可上手操作。
-
-
多语言支持(Multi-language Support):
-
SkyWalking 支持多种编程语言,包括 Java、.NET、Go、Node.js、Python、PHP 等。
-
对于每种语言,SkyWalking 都提供了相应的探针(Agent),可以自动收集应用的性能数据,无需修改代码。
-
探针支持自动注入,用户只需简单配置即可启用监控功能。
-
-
扩展性和插件机制(Extensibility and Plugin System):
-
SkyWalking 提供了强大的插件机制,用户可以根据自己的需求开发和集成自定义插件。
-
插件可以用于扩展数据源、增加新的监控指标、定制化告警规则等。
-
社区和官方提供了大量高质量的插件,用户可以根据需要选择合适的插件。
-
-
云原生支持(Cloud-Native Support):
-
SkyWalking 完全支持云原生架构,特别是 Kubernetes 和微服务架构。
-
可以轻松部署到 Kubernetes 集群中,并与 Prometheus、Grafana 等工具集成,形成完整的可观测性解决方案。
-
支持自动发现和监控 Kubernetes 中的 Pod、Service 和其他资源。
-
架构概述
SkyWalking 的架构主要由以下几个组件组成:
-
Agent(探针):
-
Agent 是 SkyWalking 的核心组件之一,负责收集应用的性能数据,包括追踪信息、指标和日志。
-
Agent 以字节码注入的方式工作,能够在不修改代码的情况下自动收集数据。
-
支持多种编程语言,每个语言都有对应的 Agent 实现。
-
-
Collector(收集器):
-
Collector 负责接收来自 Agent 的数据,并进行聚合、存储和分析。
-
支持高可用性和水平扩展,可以处理大规模集群中的海量数据。
-
Collector 内部包含了多个模块,如接收器、处理器、存储适配器等。
-
-
Storage(存储):
-
SkyWalking 支持多种存储后端,包括 Elasticsearch、H2、MySQL、TiDB、InfluxDB 等。
-
用户可以根据自己的需求选择合适的存储系统,确保数据的安全性和可扩展性。
-
存储层负责持久化追踪数据、指标和日志,提供高效的数据查询能力。
-
-
UI(用户界面):
-
UI 是 SkyWalking 的前端部分,提供了直观的 Web 界面,用户可以通过浏览器访问和操作。
-
UI 展示了各种监控数据、追踪链路和服务拓扑图,帮助用户进行问题排查和性能优化。
-
支持自定义仪表盘和主题样式,用户可以根据自己的需求进行个性化配置。
-
-
Alarm(告警):
-
Alarm 模块负责根据预设的规则生成告警,并通过指定的通知渠道发送告警信息。
-
支持多种告警策略,用户可以根据不同的场景设置不同的告警条件。
-
告警模块与存储层紧密集成,能够实时监控数据变化并触发告警。
-
使用场景
SkyWalking 广泛应用于以下领域:
-
微服务架构:在微服务架构中,SkyWalking 可以帮助用户监控和追踪多个服务之间的调用链路,识别性能瓶颈和依赖关系。
-
容器化应用:结合 Kubernetes 和 Docker,SkyWalking 可以监控容器化应用的性能,提供详细的追踪和诊断信息。
-
云原生环境:SkyWalking 支持云原生架构,能够与 Prometheus、Grafana 等工具集成,形成完整的可观测性解决方案。
-
企业级应用:对于大型企业级应用,SkyWalking 提供了全面的监控和诊断功能,帮助运维团队快速定位和解决问题。
-
DevOps 和 SRE:SkyWalking 为 DevOps 和 SRE 团队提供了强大的工具,帮助他们实现自动化监控和持续交付。
为什么选择 SkyWalking?
-
全面的可观测性:SkyWalking 提供了追踪、指标、日志和告警等全方位的可观测性功能,帮助用户全面了解应用的运行状态。
-
易于集成:支持多种编程语言和框架,用户可以轻松将其集成到现有的应用中,无需大量修改代码。
-
高性能和可扩展性:SkyWalking 具有高效的采集和处理能力,能够处理大规模集群中的海量数据,支持水平扩展。
-
活跃的社区支持:SkyWalking 拥有一个活跃的开源社区,用户可以获得大量的文档、教程和技术支持。
-
云原生兼容:完全支持云原生架构,特别是 Kubernetes 和微服务架构,能够与主流的云原生工具无缝集成。
Apache SkyWalking 使用
1. 准备工作
下载 SkyWalking
-
选择适合你操作系统的版本进行下载(例如
apache-skywalking-apm-es7-x.x.x.tar.gz
)。 -
解压下载的文件到一个合适的位置。
启动 SkyWalking OAP Server 和 UI
-
进入解压后的 SkyWalking 目录。
-
如果你使用的是 Elasticsearch 作为后端存储,请确保它已经安装并运行。
-
编辑
config/application.yml
文件,配置与你的 Elasticsearch 实例连接的信息。 -
使用命令启动 OAP 服务器:
-
Linux/Mac:
bin/startup.sh
-
Windows:
bin\startup.bat
-
-
打开浏览器访问 SkyWalking UI,默认地址是
http://localhost:8080
。
2. 配置 SkyWalking Agent
获取 SkyWalking Agent
-
在 SkyWalking 的下载包中,找到
agent
文件夹,这里包含了 SkyWalking Agent。
配置 SkyWalking Agent
-
编辑
agent/config/agent.config
文件,设置以下关键参数:
# 指定 OAP 服务器的地址
collector.backend_service=${SW_AGENT_COLLECTOR_BACKEND_SERVICES:127.0.0.1:11800}
# 设置服务名称
agent.service_name=${SW_AGENT_NAME:your-service-name}
# 设置采样率,0.0 到 1.0 之间的值,1.0 表示所有请求都被追踪
trace.sample_rate=1.0
3. 修改 Spring Boot 应用程序以包含 SkyWalking Agent
添加 JVM 参数
-
如果你是通过 IDE (如 IntelliJ IDEA) 或者命令行运行应用程序,可以在启动参数中添加
-javaagent
选项指向 SkyWalking Agent 的路径。例如:
java -javaagent:/path/to/skywalking-agent/skywalking-agent.jar -jar your-spring-boot-app.jar
(可选) 使用 Maven 或 Gradle 插件
-
对于使用构建工具管理依赖的项目,你可以选择使用官方提供的 Maven 或 Gradle 插件来简化集成过程。请参考官方文档获取更多信息。
4. 运行应用程序
-
启动你的 Spring Boot 应用程序。
-
当应用程序开始接收请求时,SkyWalking Agent 将自动收集追踪数据,并将其发送到 OAP 服务器。
5. 查看 SkyWalking UI
-
返回到 SkyWalking UI (
http://localhost:8080
)。 -
在仪表板上,你应该能够看到你的应用程序以及它的性能指标、调用链路等信息。
-
点击 "Services" 可以查看具体的服务详情,包括响应时间、吞吐量、错误率等。
-
点击 "Traces" 可以查看具体的调用链路,了解每个请求是如何在系统中传播的。
6. 高级配置 (可选)
-
告警:你可以根据需要配置告警规则,当某些性能指标超出设定范围时触发通知。
-
插件支持:如果应用中使用了其他框架或库(如 MyBatis, Redis, MongoDB),可以为这些组件添加相应的 SkyWalking 插件来增强追踪能力。
-
日志关联:如果你还使用了 SkyWalking 提供的日志收集功能,可以将日志与追踪记录关联起来,便于问题排查。
注意事项
-
在生产环境中部署 SkyWalking 时,应考虑安全性配置,如网络隔离、身份验证和授权等。
-
考虑到性能影响,应该合理设置采样率和其他性能相关的配置项,避免对生产系统造成过大的负担。
-
不同版本的 SkyWalking 可能会有不同的特性和配置方式,请务必参照对应版本的官方文档。