本文我们来聊聊DeepSeek如何用于数据分析工作者。
想要更好的将AI用于数据分析中,我们就要先弄清楚数据分析的工作可以分为几个部分,下面列举一下:
数据预处理:
- 数据收集:确保数据的质量和完整性,从可靠的来源收集数据。
- 数据清洗:处理缺失值、异常值和重复数据,确保数据的准确性和一致性。
- 数据整理:将数据转换为适合分析的格式,进行必要的转换和标准化。
数据图表:
- 数据可视化:使用图表、图形和仪表板等工具将数据可视化,帮助识别趋势、模式和异常。
- 探索性数据分析(EDA):通过可视化手段探索数据的基本特征,发现潜在的关系和结构。
模型构建:
统计分析:应用统计方法检验假设,评估变量之间的关系。
预测建模:使用机器学习等技术构建预测模型,预测未来趋势和结果。
决策:
数据解释:基于分析结果,解释数据的意义和影响。
洞察提取:从数据中提取有价值的洞察,支持业务决策。
策略制定:根据数据分析的结果,制定或调整业务策略和行动计划。
沟通和报告:
结果呈现:将分析结果以清晰、简洁的方式呈现给非技术背景的决策者。
报告撰写:编写详细的分析报告,包括方法、结果、结论和建议。
工具和技术:
- 软件工具:熟练使用数据分析软件和编程语言,如Python、R、SQL、Excel等。
- 技术方法:掌握数据挖掘、机器学习、人工智能等先进技术方法。
接下来我们细致的拆解一下每个部分能够结合DeepSeek做的事情和注意事项。
一、数据预处理
数据收集
多数数据分析工作的数据都是来自于公司内部,不过有些场景下我们需要一些网络数据作为参考,我们可以开启DeepSeek的联网搜索模式进行数据获取。示例如下:
模版:我要XXXXX,请给我提供一些数据,并注明数据来源。
为了确保数据真实性,记得要让DeepSeek标注数据来源,(不要忘记勾选联网搜索)
数据清洗
数据清洗是数据分析中很重要的一个过程,我们可以让DeepSeek给出我们一些清洗建议,也可以直接让它返回清洗好的数据。
模板:看一下整个数据表中有哪些数据需要清洗。
模板:看一下A列中有哪些异常数据。
示例如下(进行部分提取):
截止至发稿日,DeepSeek还不能直接返回数据文件,我们可以将返回的数据直接粘贴到Excel中,或者使用ChatGPT等多模态模型返回数据文件。
二、数据图表
数据可视化
DeepSeek暂不支持直接生成数据图表,ChatGPT这种多模态模型生成的内容你也会觉得“差点意思“。
其实对于数据图表来说,我们不需要刻意的使用DeepSeek这种大模型去寻找答案,很多BI工具对于数据图表的智能化可以说是遥遥领先,举例说明一下:
- BI工具
- 多数BI工具和AI模型一样,我们上传数据,简单的点点点就可以生成精美的数据图表,常见的工具有:Tableau、Power BI、Fine BI等。
- Excel + DeepSeek
- DeepSeek生成公式+Excel人工操作=Excel图表
- WPS:WPS中设有付费AI功能可以智能生成图表。
- Python/R + DeepSeek
- 对于会进行编程的人来说,我们让DeepSeek生成绘图代码,我们调整参数即可生图。
总结:在数据可视化的情景下使用DeepSeek的核心思想就是“问”
- 问XXX数据应该做什么图?
- 问Excel公式怎么写?
- 问XXX工具想要实现XXX该怎么操作?
- 问XXX图的Python代码该怎么写?
三、模型构建
统计分析
数据分析工作中我们经常需要进行数据的显著性检验,这个过程我们可以交由DeepSeek来进行。
模板:数据组数+场景+检验方法+示例数据
模板:数据+具体检验方法(请将下列数据进行配对样本T检验,数据如下…)
这里如果不知道该进行具体的哪种检验,直接告诉他数据来源(同源/异源),让其进行显著性检验即可。
示例如下:
预测建模
数据分析中有很多任务需要用到机器学习,例如对用户群进行分类、聚类,对DAU、GMV等指标进行预测等等。这些任务直接交给DeepSeek即可。
注意:小数据可以直接上传或输入,大量数据就让DeepSeek生成代码自己本地运行一下吧。
模板:[…],这是XXX数据,预测一下XXX
模板:上传Excel+这是XXX数据,"请使用A,B,C"三个特征进行用户聚类。
模板:给我一段…算法的Python代码。
示例如下:
四、决策
先说明一点,作为数据工作者,业务的理解是至关重要的,最了解业务的那个人一定是你自己,我们在决策上使用AI做的是“辅助性决策”,不要过于依赖AI!
数据解释
解释数据通常就是找到数据中的趋势、关键指标变化等内容,我们直接将数据丢给DeepSeek让它自动的解释一下整体数据或者解释某些字段即可。
洞察提取
我们可以让DeepSeek从数据中分析出一些有意义的拐点,我们可以指定人群、指标等。
模板示例:分析一下男性用户的消费习惯。
模板示例:分析一下新用户的流失情况。
我们还可以上传数据让DeepSeek帮我们进行相关性分析,异常值/异常行为检测等。
模板示例:分析一下客户满意度与售后服务响应时间的相关性
模板示例:分析一下该用户行为数据中的异常行为用户,并给出原因。
策略制定
对于策略,我们可以告诉DeepSeek你的业务场景,让它给出你一些可以参考的“辅助性决策”,示例如下:
模板示例:我从事电商销售行业,请帮我针对高价值用户的回流,给出一些策略
每个人的业务场景是不同的,我们可以根据自己的业务场景调整提问方式,不过一定要记住,DeepSeek做的是“辅助性决策”,如果要参考它的回答要仔细斟酌一下。
五、沟通和报告
结果呈现
结果呈现的方式有很多种,作为数据分析师,最拿手的就是用报告、用数据、用图去展示,但是很多人不会向不懂数据的人(不要带入你的领导)去描述,最后导致好的数据没有被重视,这个时候我们就要启动DeepSeek强大的沟通能力了。
模板:如何向不懂数据分析的人解释XXX
模板:用三岁小孩都能听懂的方式解释XXX
模板:解释一下XXX,说人话
(虽然3岁小孩可能还是听不懂,但已经足够简洁了)
报告撰写
你一定从某个介绍DeepSeek的文章上看到过,DeepSeek能快速制作数据分析报告的噱头。从事过数据分析工作的人应该都清楚,报告的撰写是有针对性,结合业务和实际场景的,有很多干扰因素是AI捕捉不到的。
和上面提到的决策同样的思路,我们可以让DeepSeek生成报告大纲进行参考,看一下有哪些点可以让我们的报告锦上添花。
举个例子:
六、工具和技术
软件工具
DeepSeek不仅能够告诉我们如何操作Excel,还可以直接给出我们想要实现的代码,让我们节省大量的工作时间,示例如下:
最后做个总结,DeepSeek虽然强大,但也不要凡事都依托于它的答案。
AI能用于辅助你工作,但不能代替你工作,真正的数据分析师,基于业务的全面思考才是最重要的!