超越 DeepSeek V3 -->【Qwen2.5-Max】

发布于:2025-02-11 ⋅ 阅读:(12) ⋅ 点赞:(0)

🔥 先说明,不是广子,不是广子!!!单纯分享这个工具给大家,毕竟最近使用 DeepSeek 太容易崩了,每天深度思考一次之后就开始转圈圈用不了,然后就找到了这个工具使用


一、前言 – DeepSeek

最近大家都知道DeepSeek 最近非常非常火🔥,我看了一下 DeepSeek 的深度思考推理能力是大家最喜欢用的一个功能,也是它相比于其他 AI 更加高明的情况,我们官网现在所用的 DeepSeek 一般指的就是最新的版本 DeepSeek-V3

但是一个 AI 它总有进阶的过程吧,就类似于我们用的豆包一样,基于大数据的搜索,此时我们看到的 DeepSeek 就是处于 DeepSeek-V3 的时期,

那么 deepseek-V3deepseek-R1 的区别在哪?

  • DeepSeek-V3(基础模型) + 推理能力(训练) = DeepSeek-R1

相当于 DeepSeek-V3 就是基础智商,而 R1 就是基于基础智商训练得到 DeepSeek-R1

DeepSeek-V3通用的自然语言处理模型

  • DeepSeek V3 采用混合专家(MoE)架构,主要面向自然语言处理(NLP)任务,旨在提供高效、可扩展的解决方案。
  • 其优势在于高效的多模态处理能力(文本、图像、音频、视频)和较低的训练成本(557.6万美元,仅需2000块H800 GPU)。
  • 在基准测试中,V3的表现接近GPT-4o和Claude-3.5-Sonnet,但更注重综合场景的适用性。

DeepSeek-R1专注于高级推理任务

  • 专为复杂推理任务设计,强化在数学、代码生成和逻辑推理领域的性能。
  • 通过大规模强化学习(RL)和冷启动技术,R1在无需大量监督微调(SFT)的情况下,实现了与OpenAI o1系列相当的推理能力。

二、初步介绍

如果要使用的话,可以去 Qwen官网,或者 阿里云百炼,都是可以的

【获得 Qwen 的 API】:教程

通义千问(Qwen):由阿里巴巴集团旗下的通义实验室自主研发的超大规模语言模型。
在这里插入图片描述

以下是其一些核心特点和优势:

1、多语言支持

  • 支持多种语言,包括但不限于中文、英文、法语、西班牙语、葡萄牙语、俄语、阿拉伯语、日语、韩语、越南语、泰语、印尼语等。
  • 可以为全球用户提供服务,并在跨语言交流中表现出色。

2、强大的对话能力

  • 经过大量训练,能够进行自然流畅的多轮对话,理解上下文关系,保持对话连贯性。
  • 在开放域问答、任务型对话、情感陪伴等方面表现优异。

3、丰富的知识库

  • 基于阿里巴巴集团内部的历史积累以及互联网上的海量数据进行训练,拥有广泛的知识覆盖范围。
  • 可以回答从科学常识到最新技术趋势的各种问题。

4、内容生成能力

  • 擅长生成各种类型的内容,例如文章、诗歌、故事、剧本、邮件、报告等。
    同时还具备代码写作能力,可以理解和生成多种编程语言的代码片段。

三、深入了解

1, Qwen vs DeepSeek

Qwen2.5-Max 其实也是类似于 DeepSeek-V3 的基础模型,而 Qwen2.5-Max 的比 DeepSeek-V3 的智商还高,在 Chatbot Arena【大模型盲测绑定】 上排名 几乎把很多 开源、闭源、前沿非推理模型都比了下去,如下:
在这里插入图片描述

Chatbot Arena 大模型盲测榜单:是通过匿名的方式去把大模型两两组队,然后让用户进行盲测,然后用户给体验好的进行投票

注意:这个也是免费的,界面很像那个 ChatGPT,如下:
在这里插入图片描述

2, 代码编写及实况预览

我们先来看看它的知识储备
在这里插入图片描述

  • 现在和我们暂时也就两个月左右的时差

然后我们来测试,先让它做一个代码并进行实况预览,如下:
在这里插入图片描述

  • 它这个实况预览还是不错的

3, 中文写作

其实 R1 在大众中的爆火,我感觉就离不开它的写作能力,当时让它给我写的一篇骈文,不得不说第一眼惊艳到我了 ,深度思考真的不错哈
在这里插入图片描述
但是我用 Qwen 生成类似的中文的话,效果还是差上不少的:

在这里插入图片描述

但是要比另外 用 V3生成的要相对好上一丢丢,我相信 Qwen2.5 应该也能很快退出它的推理模型

4, 图片视频

这个就是它相比于 DeepSeek 更加方便的地方了,它可以生成图片和视频,如下:
在这里插入图片描述
我也测试调了一下它的图片生成,发现有点过于 AI 化,但是如果再进行更详细的语言描述和调整的话就会好上很多,比我以前看到的一些AI图还是要好不少的,而且图片生成免费,速度也挺快的,这点很赞 👍

在这里插入图片描述

  • 视频生成的话,还是有点太慢了,我测了一下估摸着至少得7、8分钟 一个视频,而且还有点容易崩,如下:
    在这里插入图片描述
    如果对视频生成感兴趣的,可以去 混元 AI,这个挺好的,但是要收费

看了上面的功能,其实我们就可以让 AI 帮我们生成一些不知道怎么描述的图片,比如:装修图,可以先让 AI 给我们生成提示词,然后再用 AI 生成图片
在这里插入图片描述
然后再利用我们生成的提示词生成图片即可

值得一提的是:Qwen 2.5 有三个全家桶,针对数学的 Qwen 2.5-Math、常规的大语言模型 Qwen2.5 和专门针对编程的 Qwen2.5-Coder 模型
在这里插入图片描述
感兴趣的可以去搜一些相关知识

四、小结

总的来说,这个 Qwen2.5 的功能还是挺齐全的,代码的实况预览也是可以的,比 DeepSeek V3 是要相对好些,但是如果要和 DeepSeek R1 比的话,就还是相对差一些,毕竟现在 DeepSeek 有点卡,本地部署显卡也带不动,用 Qwen 2.5- Max 是个不错的选择啦,当然啦,也期望 Qwen 2.5-Max 也能早日推出它的推理模型,


网站公告

今日签到

点亮在社区的每一天
去签到