【java】AI内容用SSE流式输出

发布于:2025-07-14 ⋅ 阅读:(21) ⋅ 点赞:(0)

1、引言

        随着AI技术的崛起,我们也开始接触开发AI项目了。比如我使用的是springAI来调用大模型,通过一些定制化内容,得到比较有个性化的智能体。

        而调用大模型是我们后端的工作,那么如何将AI响应的内容返回给前端呢?我们当然可以直接调用完大模型后,等大模型响应完内容给我们的后端,然后后端再统一把消息返回给前端。这种方法虽然可行,但是在用户体验上就差很多了,如果后端要等大模型完整地返回内容的话,就要阻塞很久,那么用户端是无感知的,反而会觉得这个系统很差,要等这么久才能响应。

        所以我们就要达到现有较流行的打字机效果,就是AI响应一点内容,就给用户返回一些内容,要达到这种效果,就要用到SSE流式输出了。


2、包装AI响应的内容

本章节不对如何调用大模型重点讲解,后续会考虑发布相关博客,本章节之针对流式输出做讲解。所以对调用AI大模型的代码如果看不懂不需要太在意,只要知道AI输出的内容也是可以通过stream方法流式输出的即可。

    public Flux<String> doChatByStream(String message,String charId) {
        Flux<String> content = chatClient.prompt()
                .user(message)
                //这里的advisors是单词发送执行的拦截器,指定了
                .advisors(advisor -> advisor.param(CHAT_MEMORY_CONVERSATION_ID_KEY, charId)//指定会话房间
                        .param(CHAT_MEMORY_RETRIEVE_SIZE_KEY, 20))//指定记忆多少轮对话
                .stream()//使用流式输出
                .content();

        return content;
    }

代码解释:AI响应的内容是String类型的,通过调用一些函数,让Flux包装,这种其实就是响应式编程。


3、控制内容流式响应

在controller层执行,有三种方式:

@RestController
@RequestMapping("/ai/love_app")
@Slf4j
public class AiController {

    @Resource
    private LoveApp loveApp;


    @GetMapping(value = "/doChat/sse", produces = MediaType.TEXT_EVENT_STREAM_VALUE)
    public Flux<String> chat(String message, String charId) {
        Flux<String> stringFlux = loveApp.doChatByStream(message, charId);

        // 返回响应
        return stringFlux;
    }

    @GetMapping("/doChat/sse2")
    public Flux<ServerSentEvent<String>> chatBySse2(String message, String charId) {
        Flux<ServerSentEvent<String>> serverSentEventFlux =
                loveApp.doChatByStream(message, charId).map(chunk -> {
                    ServerSentEvent<String> result = ServerSentEvent.<String>builder()
                            .data(chunk)
                            .build();
                    return result;
                });
        return serverSentEventFlux;
    }

    @GetMapping("/doChat/sse3")
    public SseEmitter chatBySseEmitter(String message, String charId) {
        SseEmitter sseEmitter = new SseEmitter(180000L);//超时时间
        loveApp.doChatByStream(message, charId)
                .subscribe(chunk -> {   // 订阅数据流
                            try {
                                sseEmitter.send(chunk);// 发送数据到客户端
                            } catch (Exception e) {
                                sseEmitter.completeWithError(e);// 发送异常时,执行异常完成函数(手动关闭)
                                log.error("发送异常:{}",e);
                            }
                        }, sseEmitter::completeWithError,sseEmitter::complete);
        return sseEmitter;
    }


}

 (1)直接返回Flux对象,并添加请求头

(2)在Flux对象里面的具体响应数据再用一层ServerSentEvent包裹,不需要再加请求头


(3)专门用于SSE推流的类:SseEmitter(推荐,简单更灵活)

调用它的send函数主动向前端推送数据

 


网站公告

今日签到

点亮在社区的每一天
去签到