数据在职场中处处可见,比如汇报、写简历、做决策,就是简单的发放一个问卷调研,也要从调研结果有所洞察。可以说数据分析是打工人的必备技能了。
我在刚入职场的时候,不懂数据分析,不知道这玩意是干啥用的,感觉离自己很远。后来当了产品,要做决策,要规划下个版本,下半年做什么?为了让决策更科学,就要主动去收集信息。
比如产品的运营、销售情况、用户的需求反馈、用户行为数据等等,通常是自己来定义想要的指标,去企业内部的业务系统,或找相关业务的运营或开发拿到数据,在excel内制作图表。必要时还要设计的美观的可视化看板做汇报。
如果有经历过,就知道这个过程相当的消磨时间,特别是在excel里处理上千条内容,确定指标,绘制可视化图表,有时候一做就是一整天。
通常数据分析会涉及到的流程是:
1.数据收集与整合 :从各种来源收集原始数据,并将其整合到一个统一的数据集中
2.数据预处理与清洗 :处理缺失值、异常值,确保数据的质量和一致性
3.数据分析与挖掘 :设定指标、分析维度,挖掘数据中的规律和趋势
4.数据可视化与呈现 :通过图表和报告将分析结果转化为直观易懂的形式
这个流程对标准的数据分析产品和非标准的业务分析都同样适用,每一步都必不可少。虽然过程复杂耗时,但我们现在有了更好的解决方案。
对于上述四个步骤中,数据预处理、分析挖掘和可视化呈现都可以交给AI完成。比如下面效果👇
都是在获取到要分析的内容,结合数据分析看板生成提示词。
提示词1:数据预处理与清洗 发送要清洗的数据文件,或内容,让AI输出excel,甚至你不知道要清洗哪些字段,也可以告诉AI让他自己选择清洗。
我需要对以下数据进行清洗和预处理。请帮我分析这些数据,识别需要清洗的问题(如缺失值、异常值、重复项、格式不一致等),并进行相应的清洗处理。请执行以下任务:
1. 分析数据结构和字段类型
2. 识别并处理缺失值
3. 检测并处理异常值和离群点
4. 移除重复记录
5. 标准化和规范化数据格式
6. 根据数据特点,自行判断并执行其他必要的清洗步骤
请以表格形式展示清洗前后的数据对比,并解释您采取的每一步清洗措施及其原因。如果有多个清洗步骤,请分别展示每个步骤的结果。
提示词2:数据分析与挖掘
发送excel、或文本内容,让AI列出可以分析的指标、分析维度,以及可以制作的图表,然后选择合适的指标、维度进行制作
我需要对以下数据进行全面的分析与挖掘。请帮我分析这些数据,提供可行的分析方向和可视化建议。
请执行以下任务:
## 第一阶段:数据概览与分析可能性
1. 分析数据结构、字段类型和基本统计特征
2. 列出所有可能的分析指标(如总和、平均值、增长率、占比等)
3. 提供可行的分析维度(如时间维度、地域维度、产品维度、客户维度等)
4. 建议适合这些数据的图表类型(如折线图、柱状图、饼图、热力图、散点图等)
## 第二阶段:具体分析执行
基于上述分析,请选择最有价值的3-5个分析方向,并为每个方向:
1. 计算相关指标
2. 按照合适的维度进行分组或筛选
3. 创建对应的数据可视化图表
4. 提供对分析结果的解读和洞察
## 第三阶段:总结与建议
1. 总结数据中发现的主要趋势和模式
2. 提出基于数据分析的行动建议或决策支持
3. 指出可能需要进一步分析的方向
提示词3:数据可视化与呈现:
在获取到要分析的内容后,结合下面提示词,发送文本/Excel/PDF给大模型,就可以获取到数据分析看板
强大的代码生成能力,可制作HTMl代码,制作可交互的数据看板
# HTML数据看板生成器
## 核心任务:
请分析我提供的数据源 (\[文本/Excel/PDF] - 请指明文件类型并简述内容),提取关键洞察和量化数据。构建一个单一、自包含的HTML文件,以专业、交互友好且视觉吸引人的数据看板形式展示这些信息。
## 关键要求:
1. 数据处理与转换:
* 清晰阐述将原始输入数据转换为适用于可视化的结构化 JavaScript 对象/数组的逻辑。
* 选择3-5个核心指标,使用适合数据类型的图表(折线图、柱状图、饼图等)
* 仔细阅读内容,找出可量化的数据、关键趋势、公司案例或观点。
2. 可视化与交互性 (ECharts 核心):
* 主要库: 使用 ECharts 5.x 进行所有图表绘制。
* 图表选型: 采用最能代表数据特性和洞察的 ECharts 图表类型(如折线图、柱状图、饼图/环形图、散点图、热力图等)。
* 图表精细化: 图表必须精细调整,包含清晰的标题、坐标轴、标签、内容丰富的提示框 (Tooltip) 和可交互的图例 (Legend)。为数据密集的图表实现 `dataZoom`(区域缩放)。包含 `toolbox`(工具栏)以支持常用操作(保存图片、数据视图)。
* 目的性交互: 除默认交互外,考虑简单的筛选器、动态排序(若看板中包含表格数据)或图表联动 (ECharts `connect`) 是否能显著增强数据探索性,并在单文件上下文中可行时实现。
3. 代码结构与技术 (单一HTML文件):
* HTML: 语义化的 HTML5 结构。为不同的看板区域(如KPI、主图表、详细分解)和图表元素使用明确的 `div` 容器。
* CSS:
* 在 `<style>` 标签内嵌入 CSS,或少量使用内联样式。
* 采用功能优先的CSS方法论(例如,用于边距、内边距、Flexbox/Grid布局、排版),以实现简洁、可维护且响应式的设计,避免外部框架依赖。
* JavaScript:
* 模块化: 将 JavaScript 分解为定义良好的函数(例如 `processData()`、`createChart1Options()`、`renderChart1()`、`updateDashboardSection()`)。以此模拟组件化方式,提升代码清晰度。
* 数据流: 清晰定义数据从处理到图表配置项及渲染的流程。
* 动态内容: 如果能简化结构,使用 JavaScript 动态生成重复性元素(如信息卡片或列表项)的 HTML。
* 事件处理: 确保 ECharts 实例在 `window.resize` 时能正确 `resize()` (考虑防抖优化性能)。
4. 设计与用户体验:
* 主题与风格: \[建议一个:现代简约风、科技暗黑模式、商务专业风,或根据数据内容选择]。
* 布局: 简洁、响应式,确保在不同设备(桌面、平板、移动端)上的可读性。关键信息应突出显示。
* 色板: 使用专业且易于访问的调色板。如果涉及品牌颜色,\[请提供HEX色值]。
## 期望输出:
一个单一、完整的HTML文件,并且:
* 能在现代浏览器中无错直接运行。
* 完全响应式且视觉效果优良。
* 有效运用 ECharts 进行富有洞察力的数据可视化和交互。
* 包含结构良好且有注释的 HTML、CSS 和 JavaScript 代码。
如果你不会写提示词,还可以用PromptIDE-提示词开发工具帮你写提示词,以自动补全SQL为例。
假设我们有一个订单明细表(t_order_detail)包含order_id(订单id)、goods_id(商品id)、dept_id(门店id)、num(销量)、price(单价)、order_time(销售时间),我们需要某时间段内贡献门店80%销售额的商品。
生成的提示词如下:
# 角色:
SQL查询专家
## 背景:
用户需要根据提供的字段及需求编写SQL查询语句。这可能是因为用户需要从数据库中提取特定数据以支持业务决策、生成报告或进行数据分析。用户可能对SQL语法不熟悉,或者需要优化现有的查询语句。
## 注意:
1、用户希望通过SQL查询快速获取所需数据,因此查询语句需要高效且准确。
2、用户可能对数据库结构不熟悉,因此需要清晰的字段描述和表关系说明。
3、用户可能希望查询语句能够灵活应对不同的数据需求,因此需要具备一定的通用性和可扩展性。
## 技能:
1、精通SQL语法,能够编写复杂的查询语句。
2、熟悉数据库结构设计,能够理解表之间的关系。
3、具备优化查询性能的能力,能够编写高效的SQL语句。
4、能够根据业务需求设计查询逻辑,确保查询结果符合业务要求。
## 目标:
1、根据用户提供的字段及需求,编写准确的SQL查询语句。
2、确保查询语句能够高效执行,避免性能瓶颈。
3、提供查询语句的解释,帮助用户理解查询逻辑。
4、根据用户反馈,优化查询语句以满足不断变化的需求。
## 约束:
1、查询语句必须符合SQL语法规范。
2、查询语句必须基于用户提供的字段和表结构。
3、查询语句应尽量避免复杂的嵌套查询,以提高可读性和执行效率。
4、查询语句应考虑到数据库的性能,避免全表扫描等低效操作。
## 输入:
<字段描述>请补充需要查询的字段名称及其描述</字段描述>
<表结构>请补充相关表的名称及其字段结构</表结构>
<查询需求>请补充具体的查询需求</查询需求>
## 输出:
1、生成的SQL查询语句。
2、查询语句的解释,包括查询逻辑和字段说明。
3、查询语句的性能优化建议(如有必要)。
4、针对用户需求的进一步建议或扩展查询示例。
## 工作流:
1、分析用户提供的字段描述,明确需要查询的字段。
2、分析用户提供的表结构描述,理解表之间的关系。
3、根据用户提供的查询需求描述,设计查询逻辑。
4、编写SQL查询语句,并确保其符合语法规范和性能要求。
5、提供查询语句的解释和优化建议,帮助用户理解和使用查询结果。
接下来我们把我们的需求补充完整后发给大模型:
生成的数据如下
WITH SalesData AS (
SELECT
dept_id AS 门店,
goods_id AS 商品,
SUM(num * price) AS 累计销售额,
ROW_NUMBER() OVER (PARTITION BY dept_id ORDER BY SUM(num * price) DESC) AS 排名
FROM
t_order_detail
WHERE
order_time >= '2025-02-01' AND order_time < '2025-03-01'
GROUP BY
dept_id, goods_id
)
SELECT
门店,
商品,
累计销售额,
排名
FROM
SalesData
WHERE
累计销售额 >= (SELECT PERCENTILE_CONT(0.8) WITHIN GROUP (ORDER BY 累计销售额) FROM SalesData AS sd WHERE sd.门店 = SalesData.门店)
ORDER BY
门店 DESC, 商品 DESC;
除此之外,我们还可以用数据工坊一键生成数据分析报告。
举个例子:我们有一份销售数据,需要输出一份数据分析报告。只需要短短几步就可以完成。
上传数据,生成数据分析维度。
精调维度,生成数据分析报告。
短短几分钟,AI 不仅能够快速生成漂亮、有效的数据可视化图表,还能通过人工智能算法,提供更有价值的数据洞察,比如识别数据中的异常模式、相关性和趋势等。让数据可视化不再只是展示,而是洞察的催化剂。
同样对于生成的数据分析报告中的文字和图表还是可以进行精调。
数据分析师而言,AI 时代的到来同样蕴藏着巨大的发展红利。
那些率先理解 AI、掌握 AI、并能将其成功应用于实际工作中的人,将成为行业的佼佼者。
让我们与AI共同进步。
附:AI工具链接