理解LLM大语言模型

发布于:2025-07-18 ⋅ 阅读:(13) ⋅ 点赞:(0)

A0.LLM大语言模型及其作用

一、大语言模型 (LLMs)

LLMs是一种人工智能 (AI) 计算机系统,能够理解、生成和处理自然语言,包括根据其训练数据或在查询时提供给它们的数据回答问题。您可以了解更多关于使用 LLMs 的信息

二、代理应用

当 LLM 在应用程序中使用时,它通常用于做出决策、采取行动和/或与世界交互。这是代理应用的核心定义。

尽管代理应用的定义很广泛,但有几个关键特征定义了代理应用

  • LLM 增强:LLM 通过工具(即代码中任意可调用的函数)、内存和/或动态提示进行增强。

  • 提示链:使用多个相互构建的 LLM 调用,一个 LLM 调用的输出用作下一个调用的输入。

  • 路由:LLM 用于将应用程序路由到应用程序中的下一个适当的步骤或状态。

  • 并行性:应用程序可以并行执行多个步骤或操作。

  • 编排:使用 LLM 的层级结构来编排较低级别的操作和 LLM。

  • 反思:LLM 用于反思和验证前一步骤或 LLM 调用的输出,这可以用来指导应用程序进入下一个适当的步骤或状态。

三、代理

我们将代理定义为“代理应用”的一个具体实例。代理是一种软件,通过将 LLMs 与其他工具和内存结合,在推理循环中自主地执行任务,该循环决定接下来使用哪个工具(如果需要)。

这在实践中意味着:- 代理接收用户消息 - 代理使用 LLM,结合先前的聊天历史、工具和最新的用户消息来确定要采取的下一个适当行动 - 代理可能会调用一个或多个工具来协助处理用户的请求 - 如果使用了工具,代理将解释工具输出并用其指导下一个行动 - 一旦代理停止采取行动,它会将最终输出返回给用户

您可以了解更多关于代理的信息

四、检索增强生成 (RAG)

检索增强生成 (RAG) 是使用 LlamaIndex 构建数据支持 LLM 应用的核心技术。它通过在查询时将您的私有数据提供给 LLM,而不是在您的数据上训练 LLM,从而使 LLMs 能够回答关于您私有数据的问题。为了避免每次都将所有数据发送给 LLM,RAG 会索引您的数据,并仅选择性地将相关部分与您的查询一起发送。您可以了解更多关于 RAG 的信息

五、使用案例

大致可以分为五类

代理:代理是由 LLM 驱动的自动化决策器,通过一套工具与世界交互。代理可以执行任意数量的步骤来完成给定任务,动态决定最佳行动方案,而不是遵循预设步骤。这使其具有额外的灵活性来处理更复杂的任务。

工作流:工作流是一种特定的事件驱动抽象,允许您编排一系列步骤和 LLMs 调用。工作流可用于实现任何代理应用。

结构化数据提取 摄取大量非结构化数据并将其以结构化格式返回。这对于从 PDF、网站等非结构化源中提取结构化数据非常有用,也是自动化工作流的关键。

查询引擎:查询引擎是一个端到端流程,允许您对数据提出问题。它接收自然语言查询,并返回响应以及检索到的并传递给 LLM 的参考上下文。

聊天引擎:聊天引擎是一个端到端流程,用于与您的数据进行对话(多次往返而不是单一问答)。

A1.闭源LLM大语言模型概况(2025-07)


一、全景图:当前最活跃的 10+ 家闭源大模型(2025-07)

厂商/系列 最新版本 特长关键词 国内合规直调入口 计费模式 免费额度
OpenAI GPT-4.1 / o3 pro 通用+推理 需中转代理,官方未直连 按 token
Anthropic Claude 4 Opus 超长上下文/代码 需中转代理,官方未直连 按 token
Google Gemini 2.5 Pro 10M token 上下文 需中转代理,官方未直连 按 token
百度文心一言 ERNIE 4.5 Turbo 搜索+插件 yiyan.baidu.com 免费 不限量
阿里通义千问 Qwen3-235B-A22B MCP+Agent qianwen.aliyun.com 按 token / 包月 50 万 tokens
月之暗面 Kimi Kimi-VL-Thinking 长文档阅读 kimi.moonshot.cn 按 token 100 万 tokens/月
字节豆包 Doubao-2.0 K12 教育 doubao.com 按 token 10 万 tokens/日
智谱 ChatGLM GLM-4.0 多模态+插件 chatglm.cn 按 token 50 万 tokens
腾讯元宝 Hunyuan-T1 微信生态 yuanbao.tencent.com 按 token 50 万 tokens
讯飞星火 Spark-4.0 语音场景 xinghuo.xfyun.cn 按 token 200 万 tokens
DeepSeek DeepSeek-R1 数理推理 deepseek.com 按 token 100 万 tokens

注:GPT/Claude/Gemini 虽在全球最活跃,但**境内用户需通过合规云厂商的“中转”或“镜像”**才能稳定调用,详见下表。


二、国内合规直调通道速查表(2025-07)

原模型 国内可直连入口 获得方式 网络要求 价格 vs 官方 备注
GPT-4.1 腾讯云 TI-Platform · 大模型广场 腾讯云账号→实名→开通服务 无需 VPN 比官方贵 10-20% 仅企业实名可开
GPT-4.1 百度智能云 · 千帆大模型 百度账号→实名→开通 无需 VPN 与官方持平 支持按量/资源包
Claude 4 阿里云 PAI-灵积 阿里云账号→实名→申请白名单 无需 VPN 按 token 个人可申
Gemini 2.5 谷歌 Cloud 中国(需企业) 谷歌云 Partner 通道 需 ICP 备案 官方美元价 目前仅对 EAP 客户开放
以上所有 第三方聚合 API(OpenRouter、PPIO、Together) 直接注册 无需 VPN 加价 5-15% 适合开发者快速上线

三、计费方式对比(2025-07,人民币)

模型 输入价 输出价 计费单元 免费额度/日 省钱技巧
国内官方通道
百度文心 4.5 0 0 免费 不限 直接白嫖
阿里 Qwen3-235B ¥0.006/1k ¥0.018/1k token 50 万/月 买资源包 8 折
月之暗面 Kimi ¥0.002/1k ¥0.006/1k token 100 万/月 夜间(0-6 点)7 折
字节豆包 ¥0.001/1k ¥0.003/1k token 10 万/日 教育客户可申请折扣
智谱 GLM-4 ¥0.005/1k ¥0.015/1k token 50 万/月 学生认证领 2 倍额度
讯飞星火 ¥0.004/1k ¥0.012/1k token 200 万/月 语音场景券包
国际模型·国内镜像
GPT-4.1(腾讯云) ¥0.06/1k ¥0.18/1k token 买 1 亿 token 包 9 折
Claude 4(阿里云) ¥0.08/1k ¥0.24/1k token 夜间 8 折

1k tokens ≈ 750 英文单词 ≈ 500 汉字。


四、免费额度领取 3 步法

  1. 注册国内云账号(实名认证)
    阿里云 / 腾讯云 / 百度智能云 / 火山引擎 均可。
  2. 搜索“大模型”或“Model-as-a-Service”产品页,点击“立即开通”。
    系统会自动送 10-200 万 tokens 代金券。
  3. 在“费用中心→代金券”查看有效期,30 天内用完即可。

一句话总结

  • 想“零门槛”:直接用百度文心一言(永久免费)或各家国产大模型(送 10-200 万 tokens)。
  • 想“用 GPT/Claude”:找腾讯云、阿里云、OpenRouter 等合规镜像,价格≈官方+10%,无需翻墙。

A2.闭源LLM大语言模型落地

下面给出一份“从 0 到上线”的实操清单,分两条主线说明:

  • 客户端(CLI / Web / App /小程序)如何配置
  • 服务端(Python/Java/云函数/容器)如何集成闭源大模型

所有示例均以「国内可直接访问、无需翻墙」的闭源大模型(百度千帆、阿里DashScope、智谱GLM、月之暗面Kimi、字节豆包)为范例,时间截点为 2025-07-16。



网站公告

今日签到

点亮在社区的每一天
去签到