Java调用大模型API保姆级教程：5分钟快速上手提升开发效率

1,345 00

Java调用大模型API保姆级教程：5分钟快速上手提升开发效率

在开始之前，可以先看一下这个工具的核心使用方式——通过一个简单的HTTP请求，就能让Java程序和大模型“对话”：
Java调用大模型API示意图
图：Java程序通过HTTP请求与SiliconFlow平台的大模型交互，实现智能问答

作为一名Java开发者，你可能已经感受到了AI浪潮带来的冲击。无论是构建智能客服、知识库问答系统，还是实现代码自动生成，大模型API的调用能力正在成为现代开发者的必备技能。

但现实是，很多Java开发者面对大模型API时，往往陷入两个困境：要么被复杂的协议文档劝退，要么只会复制粘贴代码却不理解背后的原理。更糟糕的是，市面上大多数教程要么偏向Python，要么停留在理论层面，真正能让你“5分钟跑通”的Java实战教程少之又少。

今天这篇文章，我将带你从零开始，用Java完成一次完整的大模型API调用。Java调用大模型API这件事，本质上和调用一个普通的REST接口没有太大区别——你只需要理解请求格式、响应格式，以及流式与非流式的区别。

为什么Java开发者需要掌握大模型API调用？

先说说我的个人判断：未来两年，能调用大模型API的Java开发者，薪资溢价至少在30%以上。

这不是危言耸听。从2023年开始，国内外的企业级应用正在快速接入大模型能力。从阿里的通义千问、百度的文心一言，到字节的豆包、月之暗面的Kimi，几乎所有主流云厂商都在提供兼容OpenAI协议的API接口。

这意味着什么？意味着你只需要掌握一套通用的调用方式，就能快速接入不同平台的大模型服务。而Java作为企业级开发的主力语言，天然需要这种能力。

但很多Java开发者有一个使用误区：以为调用大模型API需要复杂的框架或专门的SDK。实际上，你只需要三个基础库：OkHttp（HTTP客户端）、Gson（JSON解析器），以及Java标准库本身。

核心功能拆解：大模型API调用的三个关键能力

1. 非流式调用：一次性获取完整回答

这是最基础的调用方式，适合后台任务、批量处理、接口调试等场景。你发送一个请求，等待模型生成完整回答后，一次性拿到结果。

解决什么问题：当你需要稳定的、完整的回答，且不关心响应速度时，非流式调用是最简单的选择。

2. 流式调用：实现“打字机效果”

这是提升用户体验的关键能力。模型边生成边推送，客户端实时展示，用户几乎不需要等待。

解决什么问题：在面向用户的场景中（如智能客服、知识库问答），流式调用能显著降低用户的等待焦虑。数据显示，流式调用能让用户感知响应速度提升3-5倍。

3. 多轮对话管理：手动维护上下文

大模型API本身没有记忆能力，每次调用都是独立的。要实现多轮对话，你需要手动在请求中携带历史消息。

解决什么问题：构建真正的对话系统，让模型理解上下文，而不是每次都“失忆”。

Java调用大模型API实战教程：从零到一

准备工作：注册SiliconFlow并获取API Key

为什么选择SiliconFlow？三个理由：国内平台访问方便、注册简单、兼容OpenAI协议。更重要的是，它支持Qwen、DeepSeek、GLM等多种主流模型，适合学习和实验。

注册步骤：

访问SiliconFlow官网（https://siliconflow.cn）
使用手机号注册账号
进入控制台，找到“API密钥”
点击“新建API密钥”，复制保存

进阶技巧：API Key相当于你的身份凭证，千万不要提交到Git仓库。建议使用环境变量或配置文件管理。

非流式调用：5分钟跑通第一个大模型API

这是Java调用大模型API教程中最基础的部分。我们使用OkHttp + Gson的组合，完成一次完整的API调用。

public class NonStreamingChat {
    private static final String API_URL = "https://api.siliconflow.cn/v1/chat/completions";
    private static final String API_KEY = "YOUR_API_KEY";

    public static void main(String[] args) throws IOException {
        // 1. 构建请求体
        JsonObject requestBody = new JsonObject();
        requestBody.addProperty("model", "Qwen/Qwen3-32B");
        requestBody.addProperty("temperature", 0);
        requestBody.addProperty("max_tokens", 1024);
        requestBody.addProperty("stream", false);

        JsonArray messages = new JsonArray();
        JsonObject systemMsg = new JsonObject();
        systemMsg.addProperty("role", "system");
        systemMsg.addProperty("content", "你是一个企业知识库问答助手，回答要简洁明了。");
        messages.add(systemMsg);

        JsonObject userMsg = new JsonObject();
        userMsg.addProperty("role", "user");
        userMsg.addProperty("content", "公司的年假可以拆分使用吗？");
        messages.add(userMsg);
        requestBody.add("messages", messages);

        // 2. 创建HTTP客户端
        OkHttpClient client = new OkHttpClient.Builder()
                .connectTimeout(30, TimeUnit.SECONDS)
                .readTimeout(60, TimeUnit.SECONDS)
                .build();

        // 3. 构建并发送请求
        Request request = new Request.Builder()
                .url(API_URL)
                .addHeader("Authorization", "Bearer " + API_KEY)
                .addHeader("Content-Type", "application/json")
                .post(RequestBody.create(
                        requestBody.toString(),
                        MediaType.parse("application/json")
                ))
                .build();

        // 4. 解析响应
        try (Response response = client.newCall(request).execute()) {
            String responseBody = response.body().string();
            Gson gson = new Gson();
            JsonObject jsonResponse = gson.fromJson(responseBody, JsonObject.class);
            
            String answer = jsonResponse
                    .getAsJsonArray("choices")
                    .get(0).getAsJsonObject()
                    .getAsJsonObject("message")
                    .get("content").getAsString();
            
            System.out.println("模型回答：" + answer);
        }
    }
}

代码流程解读：

构建JSON请求体，包含model、messages、temperature等参数
创建OkHttp客户端，设置超时时间（大模型响应可能较慢）
发送POST请求，携带Authorization和Content-Type头
解析响应，从choices[0].message.content中提取回答

流式调用：实现打字机效果

流式调用是Java调用大模型API怎么用的关键进阶。它基于SSE（Server-Sent Events）协议，服务端持续推送数据块。

public class StreamingChat {
    private static final String API_URL = "https://api.siliconflow.cn/v1/chat/completions";
    private static final String API_KEY = "YOUR_API_KEY";

    public static void main(String[] args) throws IOException {
        // 1. 构建请求体（stream设为true）
        JsonObject requestBody = new JsonObject();
        requestBody.addProperty("model", "Qwen/Qwen3-32B");
        requestBody.addProperty("temperature", 0.1);
        requestBody.addProperty("max_tokens", 1024);
        requestBody.addProperty("stream", true);

        // ... 构建messages（同上）

        // 2. 创建客户端（readTimeout设长一些）
        OkHttpClient client = new OkHttpClient.Builder()
                .connectTimeout(30, TimeUnit.SECONDS)
                .readTimeout(120, TimeUnit.SECONDS)
                .build();

        // 3. 发送请求并逐行读取SSE响应
        try (Response response = client.newCall(request).execute()) {
            BufferedReader reader = new BufferedReader(
                    new InputStreamReader(response.body().byteStream())
            );

            String line;
            while ((line = reader.readLine()) != null) {
                if (line.isEmpty()) continue;
                if (!line.startsWith("data: ")) continue;
                
                String data = line.substring(6);
                if ("[DONE]".equals(data)) break;

                // 解析delta.content
                JsonObject chunk = new Gson().fromJson(data, JsonObject.class);
                JsonObject delta = chunk.getAsJsonArray("choices")
                        .get(0).getAsJsonObject()
                        .getAsJsonObject("delta");
                if (delta != null && delta.has("content")) {
                    System.out.print(delta.get("content").getAsString());
                }
            }
        }
    }
}

流式调用的关键点：