SpringCloud2025+SpringBoot3.5.0+gateway+webflux子服务路由报503

发布于:2025-06-10 ⋅ 阅读:(16) ⋅ 点赞:(0)


前言

       本来昨天就应该也记录下,免得忘记的,但是有点晚了,酒没写,真的是被坑惨了。
       当然这也是追求最新的代价,也是对新技术、老知识点的重温。


一、问题

       就是网关调子服务的报503的问题,请求能进网关,子服务单独访问也正常,但是就是死活不能跳子服务,都进不了子服务在controller上打的断点(子服务也没有拦截)。

二、原因

  • 我这里是SpringCloud2025.0.0 + Springboot3.5.0,
  • 网关gateway用webflux,(spring-cloud-starter-gateway-server-webflux + spring-boot-starter-webflux)
  • 子服务还是在用传统的web,不用webflux
  • gateway配置采用动态路由
    现在的现象就是服务在nacos都是正常的:
    在这里插入图片描述
    但是用ApiFox就是不能跳转到子服务:
    在这里插入图片描述
    网关能进,也不报错:
    在这里插入图片描述
    子服务直接访问是正常:
    在这里插入图片描述

1.分析

首先,子服务是暴露了health的

management:
  endpoints:
    web:
      exposure:
        include: gateway,health,info  # 开放 Gateway 相关端点
  endpoint:
    health:
      show-details: always
    gateway:
      enabled: true  # 确保 Gateway 端点启用(默认 true)

路由侧查看路由:
在这里插入图片描述
子服务侧查看健康状态:
在这里插入图片描述
然后,通过gateway访问子服务酒报503:
在这里插入图片描述
其实报503就已经说明网关已经正常转发子服务了,出503也就几个原因:

  • 子服务被网关认为不健康,所以转发不成功
  • 子服务服务名称不正确,这个可以检查配置,或在nacos的服务列表看(动态路由)
  • 路由名称错误(静态路由)
  • 网关转发没有截取前面的url (strip-prefix的属性设置true,就会自动截取)

2.配置静态路由再试

其实,我是一个怕麻烦的人,配置能少我绝不会多写,也怕误导其他人,但是这是在是把我逼的没有办法了。
在gateway的application.yaml增加配置

spring:
  cloud:
    gateway:
      routes:
        - id: test-device-route
          uri: http://127.0.0.1:18081
          predicates:
            - Path=/test-device/**
          filters:
            - StripPrefix=1

网关试试静态路由地址:
在这里插入图片描述
       居然正常,它怎么能正常呢?为什么动态路由不正常呢?

3.定位

静态路由正常、动态路由异常,只能说明:

  • 动态路由服务名错误 (显然这个排查我做了无数遍了)
  • 路由转发了,但是子服务不正常 (显然网关转发了,但是没有进子服务,那么就是子服务反馈给注册中心的状态不可用,但是实际又是可用)

       综上,最后怀疑是服务负载均衡的有问题,现在负载均衡都是loadbalancer,应该没有Netflix Ribbon(springCloud2020后官方就移除了),那么是不是loadbalancer没有引入呢?
这个在之前搭建之前,其实我也疑惑,没有引入,以为现在新版本不需要引入了。也在ds查了:
在这里插入图片描述
       显然,我没有自定义,我就直接用动态路由了,娜我还需要引入?不管了,引入试试就是,在gateway的pom增加

<!-- 显示引入 -->
        <dependency>
            <groupId>org.springframework.cloud</groupId>
            <artifactId>spring-cloud-starter-loadbalancer</artifactId>
        </dependency>

在这里插入图片描述

然后,再试:
在这里插入图片描述
       它居然正常了,真是一口老血,那么那就可以肯定是gateway的webflux包没有引入loadbalancer以来,现在反向点他们的依赖看他们的pom:

在这里插入图片描述
在这里插入图片描述

       那这就可以结案了。


总结

       用最新的,还是很多坑,但是这应该不是spring-cloud-starter-gateway-server-webflux的bug,这不在里面直接依赖了,这样处理:

  • 依赖更粒度
  • 让架构的知识面更高,需要非常清楚
  • 另外说不定是有新的负载均衡要出现了,就想当初loadbalancer取代Ribbon一样

       好了,真是坑了半夜,昨晚都没有写,今天才复盘,希望能帮到大家,让更多在坑里的技术人爬出来。