【大模型】硅基流动对接DeepSeek使用详解

发布于:2025-02-11 ⋅ 阅读:(20) ⋅ 点赞:(0)

目录

一、前言

二、硅基流动介绍

2.1 硅基流动平台介绍

2.1.1 平台是做什么的

2.2 主要特点与功能

2.2.1 适用场景

三、硅基流动快速使用

3.1 账户注册

3.2 token获取

3.2.1 获取token技巧

四、Cherry-Studio对接DeepSeek

4.1 获取 Cherry-Studio

4.2 Cherry-Studio配置DeepSeek

4.2.1 设置api密钥

4.2.2 模型检查

4.3 与DeepSeek对话

4.4 补充说明

五、应用程序基于硅基流动对接DeepSeek

5.1 获取API文档

5.2 代码对接硅基流动使用DeepSeek

5.2.1 python代码操作示例 - 对话模型能力

5.2.1 python代码操作示例 - 生图模型能力

六、写在文末


一、前言

近期,随着DeepSeek的热度越来越高,各大厂商和大模型平台开始支持对DeepSeek的部署或接入,可以预见在接下来的一段时间内,DeepSeek的关注度将会持续走高,对于开发者或用户来说,有幸见证了这一波时代的AI红利,如何能够快速应用DeepSeek,做第一波尝鲜的人,本文将先介绍如何基于硅流流动平台快速使用和对接DeepSeek过程。

二、硅基流动介绍

2.1 硅基流动平台介绍

硅基流动(SiliconCloud)是一家致力于打造大模型时代的AI基础设施的公司,主要提供高效、低成本且全面的生成式人工智能(GenAI)模型服务。硅基流动的核心目标是通过优化大模型使用体验,帮助用户实现“Token 自由”,即以更低成本和更高效率使用先进的大语言模型(LLMs)及其他生成式人工智能(AI)模型。

快速入口:硅基流动统一登录 ,注册登录进去之后默认进到模型广场

2.1.1 平台是做什么的

硅基流动是一家专注于大规模AI计算的技术公司,由清华大学高性能计算研究所孙广宇教授团队创立。公司核心团队来自清华大学、MIT等顶尖高校,在高性能计算和AI系统方面有深厚的技术积累。主要产品和服务包括:

  • SiliconLLM: 高性能LLM推理引擎,支持各种主流大语言模型的高效部署。

  • SiliconCloud: 一站式AI云计算平台,提供LLM训练推理等服务。

  • OneDiff: 开源的AI编译框架,可自动优化AI模型性能。

产品核心优势在于深厚的系统优化技术,能大幅提升AI模型的计算效率,帮助企业降低AI部署成本。目标市场主要面向有大规模AI计算需求的企业客户。

2.2 主要特点与功能

硅基流动具备如下特点:

  • 丰富的大模型支持

    • 平台集成多种主流开源大模型,包括文本生成模型如DeepSeek R1 & V3、Qwen2.5、GLM-4、Llama-3.X、Gemma-2、InternLM、Yi-1.5等,以及图片生成模型如Janus-Pro、Stable Diffusion(SDXL)、FLUX等。

  • 多模态模型支持

    • 支持文本生成语音、文本生成图像、文本生成视频等功能。代码生成模型包括Qwen2.5-Coder-32B-Instruct等。

  • 高性价比优势

    • 提供行业内较低的API调用价格,例如Qwen2-72B模型的调用费用仅为4.13元/百万Token。对于9B及以下的模型,平台提供永久免费API服务,适合个人开发者及小型项目使用。

  • 便捷的使用体验

    • 用户无需自建硬件或进行复杂配置,只需通过API调用模型。平台提供统一的API接口,支持多种模型的无缝切换,显著提升开发效率。

  • 推理加速与性能优化

    • 平台内置推理加速引擎(如SiliconLLM和OneDiff),显著提升模型的响应速度及生成效率。支持大模型的微调与托管,用户可根据自定义数据优化模型性能。

  • 免费体验与开发支持

    • 提供免费体验中心(Playground),用户可直接测试文本生成、图像生成、文本生成语音、文本生成视频等功能。提供详尽的文档和社区支持,降低开发门槛,促进开发者使用和创造。

  • 应用接入大模型简单

    • 在该平台上,针对一些主流的大模型,提供了快速便捷的对接入口,方便开发者快速进行接入使用。

2.2.1 适用场景

硅基流动适用于各种需要高效、低成本AI服务的场景,包括但不限于文本生成、图像生成、语音生成、视频生成等。其便捷的使用体验和高性价比的优势使得硅基流动成为开发者和企业在AI应用开发中的理想选择。

  • 企业级 AI 应用开发:

    • 通过低成本的 API 服务,迅速将大模型集成到企业产品中。

  • 个人开发者与 AI 爱好者:

    • 无需依赖昂贵的硬件支持,便可使用顶尖大模型进行实验和创新。

  • 多模态内容生成:

    • 支持文本、语音、图像和视频的生成,适用于内容创作者和设计师。

  • 模型微调与定制:

    • 企业可上传自有数据,对模型进行微调,从而满足特定业务需求。

硅基流动(SiliconCloud)致力于为开发者提供一个集成多种开源大模型并配备优化 API 服务的高效、灵活且经济高效的 AI 开发平台。它不仅支持个人开发者快速将创意转化为实际项目,也为企业用户提供了简化的途径来实现生成式 AI 应用的迅速落地。通过整合这些资源和服务,该平台有效地降低了技术实施的门槛与成本,使得更广泛的用户群体能够轻松接触和应用先进的大语言模型与生成式 AI 技术。

三、硅基流动快速使用

3.1 账户注册

正常注册并登录进去后,进入到展示模型列表页面,即模型广场,可以看到,这里提供了非常多的模型可供选择和使用

3.2 token获取

类似于使用其他的开源大模型,比如ChatGPT,文心一言等,如果你通过平台的方式使用,或者后续集成到代码中进行使用时,需要走token计费,典型的像我们在代码中调用ChatGPT的openai接口时,都是按照token进行计费的,在这里,硅基流动也类似,只不过目前新账号注册之后,官方会默认赠送一定的付费额度

3.2.1 获取token技巧

也可以通过邀请好友注册的方式获取一定额度的token,如下,在我的邀请这里,将邀请链接发送给好友,好友通过这个链接注册成功后,平台就会为你赠送一定的额度。比如在下面的个人邀请列表中可以看到邀请的用户注册信息。

四、Cherry-Studio对接DeepSeek

如何基于上述硅基流动平台在本地使用deepseek呢?这里推荐两个本地客户端工具Cherry-Studio,Chatbox,两个工具都可以作为本地管理AI大模型的工具使用,下面以Cherry-Studio为例进行说明。

4.1 获取 Cherry-Studio

Cherry-Studio下载地址:Cherry Studio - 全能的AI助手

网盘中提供了不同操作系统的安装包,根据你的操作系统进行选择下载即可

我这里选择windows版本的下载到本地之后,直接双击安装即可

安装成功后,启动工具主页如下图所示

4.2 Cherry-Studio配置DeepSeek

4.2.1 设置api密钥

点击右下方的设置按钮,拷贝硅基流动官网上面的那个你创建的apikey到这里

即下面这个密钥,如果还没有的话,点击新建API密钥即可,然后拷贝到上面的那个地方

4.2.2 模型检查

密钥贴进去之后,为了确保后续对接模型能够正常使用,点击后面的检查按钮,在弹出的下拉框中

上一步配置完成之后,在默认模型菜单栏中,将下面的三个选型全部选择为deepseek-v3的这个模型

4.3 与DeepSeek对话

在上面的配置都完成之后,回到消息对话窗口,在顶部就可以看到模型切换为deepseek-v3的模型了

然后你就可以在当前的对话窗口进行对话了,比如在下面我输入了一个早上好,模型就给了回复

  • 这里要注意的是,你在这个窗口与deepseek对话,消耗的是你在硅基流动平台的token额度,因此需要及时关注自己的账户额度情况。

更多的可以自己尝试,可以像使用其他大模型一样使用

费用账单检查,在硅基流动官网的费用账单那里实时关注自己的额度使用情况

4.4 补充说明

在硅基流动官网的文档中心中,从下面的入口点进去

在文档中心的左侧可以发现,除了上面推荐的两种工具,还有很多其他类型的客户端工具可以选择使用,包括怎么在工具中进行配置都有详细的说明

五、应用程序基于硅基流动对接DeepSeek

5.1 获取API文档

如何在应用程序中使用DeepSeek功能呢,如下在硅基流动官网展示的DeepSeek模型详情中,也提供了不同开发语言,以DeepSeek-R1模型为例,进去之后点击API文档

进入到当前模型的API文档对接中心,在这里提供了完善的对接说明,包括种主流开发语言的示例代码

5.2 代码对接硅基流动使用DeepSeek

在文档中心的左侧,可以提供了很多模型能力,比如推理能力,视频转换能力,文本转语音能力等,下面用代码体验下其中的模型能力。

5.2.1 python代码操作示例 - 对话模型能力

参考下面的代码示例,在python程序中使用deepseek,注意替换参数中的token为你自己的

import requests

url = "https://api.siliconflow.cn/v1/chat/completions"

payload = {
    "model": "deepseek-ai/DeepSeek-V3",
    "messages": [
        {
            "role": "user",
            "content": "中国大模型行业2025年将会迎来哪些机遇和挑战?"
        }
    ],
    "stream": False,
    "max_tokens": 512,
    "stop": ["null"],
    "temperature": 0.7,
    "top_p": 0.7,
    "top_k": 50,
    "frequency_penalty": 0.5,
    "n": 1,
    "response_format": {"type": "text"},
    "tools": [
        {
            "type": "function",
            "function": {
                "description": "<string>",
                "name": "<string>",
                "parameters": {},
                "strict": False
            }
        }
    ]
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.request("POST", url, json=payload, headers=headers)

print(response.text)

运行上面的代码,在控制台输出了响应结果

5.2.1 python代码操作示例 - 生图模型能力

进入生图模型能力文档中心:创建图片生成请求 - SiliconFlow,可以参考其中的详细说明进行对接。

参考下面的示例代码

import requests

url = "https://api.siliconflow.cn/v1/images/generations"

payload = {
    "model": "deepseek-ai/Janus-Pro-7B",
    "prompt": "an island near sea, with seagulls, moon shining over the sea, light house, boats int he background, fish flying over the sea",
    "seed": 4999999999
}
headers = {
    "Authorization": "Bearer 你的apikey",
    "Content-Type": "application/json"
}

response = requests.request("POST", url, json=payload, headers=headers)

print(response.text)

运行上面的代码,在控制台中输出了生成的图片的url链接,可以在浏览器中打开链接看看效果

六、写在文末

本文详细介绍了硅基流动这个平台的使用,以及如何基于硅基流动对接和使用DeepSeek大模型,最后通过本地客户端工具演示了如何像使用官方的DeepSeek一样去使用,以及如何在代码中集成和使用DeepSeek提供的相关的模型能力,希望对看到的同学有用,本篇到此结束,感谢观看。