分布式链路追踪
在微服务框架中,一个由客户端发起的请求在后端系统中会经过多个不同的的服务节点调用来协同产生最后的请求结果,每一个前段请求都会形成一条复杂的分布式服务调用链路,链路中的任何一环出现高延时或错误都会引起整个请求最后的失败。
在大规模分布式与微服务集群下,
- 如何实时观测系统的整体调用链路情况。
- 如何快速发现并定位到问题。
- 如何尽可能精确的判断故障对系统的影响范围与影响程度。
- 如何尽可能精确的梳理出服务之间的依赖关系,并判断出服务之间的依赖关系是否合理。
- 如何尽可能精确的分析整个系统调用链路的性能与瓶颈点。
- 如何尽可能精确的分析系统的存储瓶颈与容量规划。
上述问题就是我们的落地议题答案:
分布式链路追踪技术要解决的问题,分布式链路追踪(Distributed Tracing),就是将一次分布式请求还原成调用链路,进行日志记录,性能监控并将一次分布式请求的调用情况集中展示。比如各个服务节点上的耗时、请求具体到达哪台机器上、每个服务节点的请求状态等等。
1. 分布式链路追踪原理
链路追踪会在每个服务调用的时候加上Trace ID和Span ID,Trace ID作为每一条链路的唯一标识,Span表示链路中各个调用的发起方信息,各个Span通过parent id关联起来。如下图:
编号 | 步骤内容 |
---|---|
1 | 第一个节点:Span ID = A,Parent ID = null,Service 1 接收到请求。 |
2 | 第二个节点:Span ID = B,Parent ID= A,Service 1 发送请求到 Service 2 返回响应给Service 1 的过程。 |
3 | 第三个节点:Span ID = C,Parent ID= B,Service 2 的 中间解决过程。 |
4 | 第四个节点:Span ID = D,Parent ID= C,Service 2 发送请求到 Service 3 返回响应给Service 2 的过程。 |
5 | 第五个节点:Span ID = E,Parent ID= D,Service 3 的中间解决过程。 |
6 | 第六个节点:Span ID = F,Parent ID= C,Service 3 发送请求到 Service 4 返回响应给 Service 3 的过程。 |
7 | 第七个节点:Span ID = G,Parent ID= F,Service 4 的中间解决过程。 |
8 | 通过 Parent ID 就可找到父节点,整个链路即可以进行跟踪追溯了。 |
2. 链路追踪之Sleuth
Spring Cloud Sleuth是一个分布式跟踪解决方案,用于跟踪分布式系统中的请求。它为每个请求生成唯一的跟踪ID,并将这些ID添加到请求中,以便跟踪请求在不同服务之间的传递情况。
Spring Cloud Sleuth3.1之后合并到Micrometer Tracing项目中,原项目Spring Cloud Sleuth不再更新维护,如果要使用Spring Cloud Sleuth,只能支持SpringBoot2使用, SpringBoot3.X需要使用Micrometer Tracing。
3. 链路追踪之Micrometer
Micrometer Tracing项目基于Spring Cloud Sleuth,脱离Spring的Micrometer Tracing可以对任意Java程序开展追踪收集活动。官网地址为:https://docs.micrometer.io/tracing/reference/index.html。
4. 链路追踪显示之Zipkin
4.1 Zipkin简介
Zipkin是一种分布式链路跟踪系统图形化的工具,Zipkin是Twitter开源的分布式跟踪系统,能够收集微服务运行过程中的实时调用链路信息,并能够将这些调用链路信息展示到Web图形化界面上供开发人员分析,开发人员能够从ZipKin中分析出调用链路中的性能瓶颈,识别出存在问题的应用程序,进而定位问题和解决问题。
4.2 Zipkin安装运行
官网地址为https://zipkin.io/, 点击下载即可下载jar包: 由于国外网址下载较慢,可以使用华为云镜像仓库下载:zipkin-server-2.27.1-exec.jar 启动zipkin,在命令行中输入:
C:\Users\mi>java -version
java version "1.8.0_271"
Java(TM) SE Runtime Environment (build 1.8.0_271-b09)
Java HotSpot(TM) 64-Bit Server VM (build 25.271-b09, mixed mode)
C:\Users\mi>set path=D:\jdk\jdk-17.0.4.1\bin
C:\Users\mi>java -version
java version "17.0.4.1" 2022-08-18 LTS
Java(TM) SE Runtime Environment (build 17.0.4.1+1-LTS-2)
Java HotSpot(TM) 64-Bit Server VM (build 17.0.4.1+1-LTS-2, mixed mode, sharing)
C:\Users\mi>java -jar "C:\Users\mi\Downloads\zipkin-server-2.27.1-exec.jar"
访问控制台http://127.0.0.1:9411/zipkin/, 出现如下页面即安装完毕:
5. Micrometer+Zipkin搭建链路跟踪
Micrometer负责数据采样,Zipkin负责UI展示。
5.2 修改cloud-provider-payment8001工程
- 修改pom.xml文件:
<!--micrometer-tracing指标追踪 -->
<dependency>
<groupId>io.micrometer</groupId>
<artifactId>micrometer-tracing</artifactId>
</dependency>
<!--micrometer-tracing-bridge-brave适配zipkin的桥接包 -->
<dependency>
<groupId>io.micrometer</groupId>
<artifactId>micrometer-tracing-bridge-brave</artifactId>
</dependency>
<!--micrometer-observation -->
<dependency>
<groupId>io.micrometer</groupId>
<artifactId>micrometer-observation</artifactId>
</dependency>
<!--feign-micrometer -->
<dependency>
<groupId>io.github.openfeign</groupId>
<artifactId>feign-micrometer</artifactId>
</dependency>
<!--zipkin-reporter-brave -->
<dependency>
<groupId>io.zipkin.reporter2</groupId>
<artifactId>zipkin-reporter-brave</artifactId>
</dependency>
其中micrometer-tracing-bridge-brave组件用于与分布式跟踪工具Brave集成,以收集应用程序的分布式跟踪数据。Brave是一个开源的分布式跟踪工具,它可以帮助用户在分布式系统中跟踪请求的流转,它使用一种称为"跟踪上下文"的机制,将请求的跟踪信息存储在请求的头部,然后将请求传递给下一个服务。在整个请求链中,Brave会将每个服务处理请求的时间和其他信息存储到跟踪数据中,以便用户可以了解整个请求的路径和性能。
2. 修改application.yml,添加如下内容
management:
zipkin:
tracing:
# zipkin地址
endpoint: http://localhost:9411/api/v2/spans
tracing:
sampling:
probability: 1.0 #采样率默认为0.1(0.1就是10次只能有一次被记录下来),值越大收集越及时。
- 新建PayMicrometerController.java
@RestController
public class PayMicrometerController {
/**
* Micrometer(Sleuth)进行链路监控的例子
*/
@GetMapping(value = "/pay/micrometer/{id}")
public String myMicrometer(@PathVariable("id") Integer id) {
String msg = "Hello, 欢迎到来myMicrometer inputId: "+id+" \t 服务返回:" + IdUtil.simpleUUID();
return ResultData.success(msg);
}
}
5.3 修改cloud-api-commons接口工程
修改PayFeignApi
/**
* Micrometer(Sleuth)进行链路监控的例子
*/
@GetMapping(value = "/pay/micrometer/{id}")
public String myMicrometer(@PathVariable("id") Integer id);
5.4 修改cloud-consumer-feign-order80工程
- 修改pom.xml文件:
<!--micrometer-tracing指标追踪 -->
<dependency>
<groupId>io.micrometer</groupId>
<artifactId>micrometer-tracing</artifactId>
</dependency>
<!--micrometer-tracing-bridge-brave适配zipkin的桥接包 -->
<dependency>
<groupId>io.micrometer</groupId>
<artifactId>micrometer-tracing-bridge-brave</artifactId>
</dependency>
<!--micrometer-observation -->
<dependency>
<groupId>io.micrometer</groupId>
<artifactId>micrometer-observation</artifactId>
</dependency>
<!--feign-micrometer -->
<dependency>
<groupId>io.github.openfeign</groupId>
<artifactId>feign-micrometer</artifactId>
</dependency>
<!--zipkin-reporter-brave -->
<dependency>
<groupId>io.zipkin.reporter2</groupId>
<artifactId>zipkin-reporter-brave</artifactId>
</dependency>
- 修改application.yml,添加如下内容
spring:
application:
name: cloud-consumer-order
cloud:
consul:
host: localhost
port: 8500
discovery:
prefer-ip-address: true #优先使用服务ip进行注册
service-name: ${spring.application.name}
openfeign:
client:
config:
default:
connectTimeout: 3000
#读取超时时间
readTimeout: 3000
httpclient:
hc5:
enabled: true
profiles:
active: circuit_cout
logging:
level:
com:
rocket:
springcloud:
common:
apis:
PayFeignApi: debug
# zipkin图形展现地址和采样率设置
management:
zipkin:
tracing:
endpoint: http://localhost:9411/api/v2/spans
tracing:
sampling:
probability: 1.0 #采样率默认为0.1(0.1就是10次只能有一次被记录下来),值越大收集越及时。
- 新建OrderMicrometerController.java
@RestController
@Slf4j
public class OrderMicrometerController {
@Resource
private PayFeignApi payFeignApi;
@GetMapping(value = "/consumer/micrometer/{id}")
public String myMicrometer(@PathVariable("id") Integer id) {
return payFeignApi.myMicrometer(id);
}
}
5.5 测试验证
- 启动支付和订单微服务
- 调用链路跟踪接口:
- 查看日志:
- 访问zipkin控制台,查看调用链路情况:
- 点击页面中show按钮。可以看到请求中间经过断路器:
6.还可以查看微服务之间的依赖情况: - 图形化也可以看到parentId: