FineBI(三)- 数据处理与分析

发布于:2025-06-30 ⋅ 阅读:(22) ⋅ 点赞:(0)

文章目录


一、数据处理

1. 新建分析文件夹

我的分析中新建图书文件夹,用于存储分析主题,如下图所示。

在这里插入图片描述

2. 新建分析主题

选中图书目录,点击新建分析主题,如下图所示。

在这里插入图片描述

选择数据页面选择books数据,并点击确定,如下图所示。

在这里插入图片描述

在显示的数据页面点击保存后,关闭此网页,如下图所示。

在这里插入图片描述

返回分析主题可以看到对应数据,如下图所示。

在这里插入图片描述

分析主题重命名为数据处理,如下图所示。

在这里插入图片描述

3. 重复值处理

在 FineBI 中,重复值删除(删除重复行)作为数据清洗环节实用功能,用于解决数据集中重复记录问题,保障分析数据唯一性。其去重规则包含两种:一是全字段去重,即勾选 “全选字段” 后,系统对比每一行所有字段值,仅当所有字段内容完全一致时,判定为重复行;二是部分字段去重,适用于更灵活场景,可指定特定字段(如 “书名 + 出版社 + 出版年份” ),只要这些字段组合的值重复,就判定为重复行 。

点击编辑后会进入数据编辑页面,编辑按钮位置如下图所示。

在这里插入图片描述

数据编辑页面如下图所示。

在这里插入图片描述

点击删除重复行,选择需要进行去重的字段,此处选择书名(只要书名重复则删除整行),如下图所示。

在这里插入图片描述

处理之后点击右上角保存更新数据,如下图所示。

在这里插入图片描述

4. 字段设置

字段设置用于选择字段、修改字段名称和设置数据类型;在FineBI中,数据类型分为三种(文本、数值、日期),表示的符号如下图所示。
在这里插入图片描述

修改字段名称:把价格字段修改为图书价格。点击字段设置,找到价格字段并双击即可进行字段修改,如下图所示。

在这里插入图片描述

选择字段:不显示图书ID字段。在字段设置中,找到图书ID字段并取消前面的选中,如下图所示。

在这里插入图片描述

设置数据类型:把图书价格字段设置为数值类型。在字段设置中,找到图书价格字段并设置数据类型为数值,如下图所示。

在这里插入图片描述

处理之后点击右上角保存更新数据。

5. 过滤

在FineBI中,过滤分为条件过滤和公式过滤,且可以添加多个过滤,设置多个过滤之间是连接还是连接,过滤选择如下图所示。

在这里插入图片描述

5.1 条件过滤

在 FineBI 的数据处理流程里,条件过滤功能针对不同字段类型,提供了精细化的筛选逻辑,具体可分为文本过滤、数值过滤与日期过滤三类场景:
文本字段过滤:当处理如名称、描述等文本型数据时,支持 10 种筛选条件:「属于、不属于、包含、不包含、为空、非空、开头是、开头不是、结尾是、结尾不是」

数值字段过滤:数值型数据覆盖 12 种筛选逻辑:「介于、不介于、等于、不等于、大于、小于、大于等于、小于等于、最大的 N 个、最小的 N 个、为空、非空」

日期字段过滤:提供 10 种时间筛选规则:「属于、不属于、某个日期之前、某个日期之后、等于、不等于、日期最早的 N 个、日期最晚的 N 个、为空、非空」

示例:过滤出图书名非空且图书价格大于0并小于500的所有数据,步骤如下图所示。

在这里插入图片描述

处理之后点击右上角保存更新数据。

5.2 公式过滤

FineBI的公式过滤支持通过自定义计算逻辑对表字段进行条件筛选,具备以下核心特性:

  • 灵活计算能力:可组合使用基础运算符号(加+、减-、乘×、除÷、括号())及内置函数,针对数值、文本等字段构建复杂过滤条件。

  • 智能校验机制:输入公式时系统实时检测语法合法性,自动提示括号不匹配、函数参数错误等问题,降低操作门槛。

  • 跨字段关联过滤:支持引用多字段进行组合计算,如通过(评分人数 / 出版年份) > 100筛选高人气新书,满足业务场景下的深度数据筛选需求。

公式过滤部分截图如下图所示。

在这里插入图片描述

6. 重命名

修改books处理后数据,如下图所示。

在这里插入图片描述

修改完成后,点击右上角保存,并关闭网页。


二、数据分析

1. 评分分布分析

清晰呈现图书评分的整体分布形态(如评分集中在 3 - 4 分区间,还是 4 - 5 分区间),判断数据集中图书质量的整体口碑,识别评分异常值(极低或极高评分),为后续筛选优质/待优化图书提供基础依据。

1.1 新建分析主题

选中图书目录,点击新建分析主题,如下图所示。

在这里插入图片描述

1.2 选择数据

此处选择对处理后的数据进行分析,在选择数据页面选择我的分析中的数据处理中的处理后数据,并点击确定,如下图所示。

在这里插入图片描述

1.3 新增赋值列

在分析主题页面点击新增赋值列,在弹出的页面中设置新增列的列名,选择赋值依据字段为评分字段,选择分组赋值方式为自定义,根据评分范围设置5个分组,如果有不在分组中的值则分组到其他,并点击确定,如下图所示。

在这里插入图片描述

确定之后,可在下方数据中看到评分范围字段及数据,如下图所示。

在这里插入图片描述

1.4 分组汇总

点击分组汇总,拖动评分范围分组汇总处,并双击汇总处的名称修改为图书数量,选择汇总方式为记录个数,如下图所示。

在这里插入图片描述

1.5 重命名

修改处理后数据评分分布分析,如下图所示。

在这里插入图片描述

双击左上角的分析主题修改为数据分析,然后点击保存,如下图所示。

在这里插入图片描述

1.6 查看分析结果

返回我的分析页面,进行数据更新,步骤如下图所示。

在这里插入图片描述

更新数据后,可以看到评分分布分析的结果数据,如下图所示。

在这里插入图片描述

2. 价格分布分析

统计图书价格在不同区间的数量占比,明确数据集中“低价书、中价书、高价书”的分布结构,辅助采购/定价策略(如判断目标用户对价格的接受偏好)。

2.1 选择数据

此处选择对处理后的数据进行分析,在选择数据页面选择我的分析中的数据处理中的处理后数据,并点击确定,如下图所示。

在这里插入图片描述

2.2 条件标签列

在分析主题页面点击条件标签列,在弹出的页面中设置条件标签列名价格范围,并添加6个标签,依次设置每个标签的显示文本,然后添加条件、选择字段图书价格、设置对应的价格范围,并点击确定,如下图所示。

在这里插入图片描述

确定之后,可在下方数据中看到价格范围字段及数据,如下图所示。

在这里插入图片描述

2.3 分组汇总

点击分组汇总,拖动价格范围分组汇总处,并双击汇总处的名称修改为图书数量,选择汇总方式为记录个数,如下图所示。

在这里插入图片描述

2.4 重命名

修改处理后数据价格分布分析,如下图所示。

在这里插入图片描述

保存分析后的数据,点击右上角保存,如下图所示。

在这里插入图片描述

2.5 查看分析结果

返回我的分析页面,进行数据更新,步骤如下图所示。

在这里插入图片描述

更新数据后,可以看到价格分布分析的结果数据,如下图所示。

在这里插入图片描述

3. 出版社图书数量统计分析

量化各出版社的图书出版规模,识别数据集中的“主力出版社”(如人民文学出版社、中信出版社的出书量),分析出版资源的市场集中度,为合作优先级、资源投入方向提供参考。

3.1 选择数据

此处选择对处理后的数据进行分析,在选择数据页面选择我的分析中的数据处理中的处理后数据,并点击确定,如下图所示。

在这里插入图片描述

3.2 分组汇总

点击分组汇总,拖动出版社分组汇总处,并双击汇总处的名称修改为图书数量,选择汇总方式为记录个数,如下图所示。

在这里插入图片描述

3.3 重命名

修改处理后数据为**出版社图书数量统计分析 **,如下图所示。

在这里插入图片描述

保存分析后的数据,点击右上角保存,如下图所示。

在这里插入图片描述

3.4 查看分析结果

返回我的分析页面,进行数据更新,步骤如下图所示。

在这里插入图片描述

更新数据后,可以看到出版社图书数量统计分析的结果数据,如下图所示。

在这里插入图片描述

4. 出版社图书评分表现分析

对比不同出版社的平均评分,评估出版社的整体图书质量口碑(如中信出版社 vs 人民文学出版社),筛选“高口碑出版社”,为选品合作、用户推荐提供依据。

4.1 选择数据

此处选择对处理后的数据进行分析,在选择数据页面选择我的分析中的数据处理中的处理后数据,并点击确定,如下图所示。

在这里插入图片描述

4.2 分组汇总

点击分组汇总,拖动出版社分组处,拖动评分汇总处,并双击汇总处的名称修改为平均评分,选择汇总方式为平均,如下图所示。

在这里插入图片描述

4.3 重命名

修改处理后数据为**出版社图书评分表现分析 **,如下图所示。

在这里插入图片描述

保存分析后的数据,点击右上角保存,如下图所示。

在这里插入图片描述

4.4 查看分析结果

返回我的分析页面,进行数据更新,步骤如下图所示。

在这里插入图片描述

更新数据后,可以看到出版社图书评分表现分析的结果数据,如下图所示。

在这里插入图片描述

5. 类别数量分布分析

统计心理学、社会学等类别图书的数量占比,识别数据集中的“热门类别”(如文学类是否占主导),反映市场/数据集的内容倾向,辅助内容采购、分类运营。

5.1 选择数据

此处选择对处理后的数据进行分析,在选择数据页面选择我的分析中的数据处理中的处理后数据,并点击确定,如下图所示。

在这里插入图片描述

5.2 分组汇总

点击分组汇总,拖动类别分组汇总处,并双击汇总处的名称修改为图书数量,选择汇总方式为记录个数,如下图所示。

在这里插入图片描述

5.3 重命名

修改处理后数据类别数量分布分析,如下图所示。

在这里插入图片描述

保存分析后的数据,点击右上角保存,如下图所示。

在这里插入图片描述

5.4 查看分析结果

返回我的分析页面,进行数据更新,步骤如下图所示。

在这里插入图片描述

更新数据后,可以看到类别数量分布分析的结果数据,如下图所示。

在这里插入图片描述

6. 类别评分情况分析

对比不同类别图书的平均评分、评分人数,判断读者对各类别的喜好差异(如艺术类 vs 科学类),识别“高口碑但小众”或“低口碑但热门”类别,优化内容推广策略。

6.1 选择数据

此处选择对处理后的数据进行分析,在选择数据页面选择我的分析中的数据处理中的处理后数据,并点击确定,如下图所示。

在这里插入图片描述

6.2 分组汇总

点击分组汇总,拖动类别分组处,拖动评分汇总处,并双击汇总处的名称修改为平均评分,选择汇总方式为平均,如下图所示。

在这里插入图片描述

6.3 重命名

修改处理后数据类别评分情况分析,如下图所示。

在这里插入图片描述

保存分析后的数据,点击右上角保存,如下图所示。

在这里插入图片描述

2.5 查看分析结果

返回我的分析页面,进行数据更新,步骤如下图所示。

在这里插入图片描述

更新数据后,可以看到类别评分情况分析的结果数据,如下图所示。

在这里插入图片描述

7. 价格随时间变化趋势分析

追踪 2000 - 2023 年图书平均价格的变化曲线,识别价格波动节点(如某年份价格骤升/降),关联行业事件(如纸价上涨、电商促销)分析原因,为成本控制、定价预测提供参考。

7.1 选择数据

此处选择对处理后的数据进行分析,在选择数据页面选择我的分析中的数据处理中的处理后数据,并点击确定,如下图所示。

在这里插入图片描述

7.2 分组汇总

点击分组汇总,拖动出版年份分组处,拖动图书价格汇总处,并双击汇总处的名称修改为平均价格,选择汇总方式为平均,如下图所示。

在这里插入图片描述

7.3 排序

根据出版年份进行升序排序,步骤如下图所示。

在这里插入图片描述

7.4 重命名

修改处理后数据价格随时间变化趋势分析,如下图所示。

在这里插入图片描述

保存分析后的数据,点击右上角保存,如下图所示。

在这里插入图片描述

7.5 查看分析结果

返回我的分析页面,进行数据更新,步骤如下图所示。

在这里插入图片描述

更新数据后,可以看到价格随时间变化趋势分析的结果数据,如下图所示。

在这里插入图片描述

8. 评分随时间变化趋势分析

观察不同年份出版图书的平均评分走势,判断“新书是否评分更高”“某些年份是否存在质量波动”,关联出版政策、市场环境变化,为选题质量把控提供依据。

8.1 选择数据

此处选择对处理后的数据进行分析,在选择数据页面选择我的分析中的数据处理中的处理后数据,并点击确定,如下图所示。

在这里插入图片描述

8.2 分组汇总

点击分组汇总,拖动出版年份分组处,拖动评分汇总处,选择汇总方式为平均,如下图所示。

在这里插入图片描述

8.3 排序

根据出版年份进行升序排序,步骤如下图所示。

在这里插入图片描述

8.4 评分保留一位小数

把评分四舍五入保留一位小数,点击新增公式列,输入列名为平均评分,点击ROUND函数并设置评分保留一位小数,然后点击确定,步骤如下图所示。

在这里插入图片描述

设置不显示评分字段,点击字段设置,取消评分字段的勾选,步骤如下图所示。

在这里插入图片描述

8.5 重命名

修改处理后数据评分随时间变化趋势分析,如下图所示。

在这里插入图片描述

保存分析后的数据,点击右上角保存,如下图所示。

在这里插入图片描述

8.6 查看分析结果

返回我的分析页面,进行数据更新,步骤如下图所示。

在这里插入图片描述

更新数据后,可以看到评分随时间变化趋势分析的结果数据,如下图所示。

在这里插入图片描述

9. 价格与评分关系分析

验证“价格越高,评分是否越高”的假设,通过价格区间(如 50 元以下 vs 100 元以上)与平均评分的关联,判断价格对读者评价的影响,辅助定价策略优化(如高价书是否需匹配更高质量)。

9.1 选择数据

此处选择对处理后的数据进行分析,在选择数据页面选择我的分析中的数据处理中的处理后数据,并点击确定,如下图所示。

在这里插入图片描述

9.2 新增赋值列

在数据分析页面点击新增赋值列,在弹出的页面中设置新增列的列名,选择赋值依据字段为图书价格字段,选择分组赋值方式为自定义,根据价格范围设置6个分组,如果有不在分组中的值则分组到其他,并点击确定,如下图所示。

在这里插入图片描述

确定之后,可在下方数据中看到价格范围字段及数据,如下图所示。

在这里插入图片描述

9.3 新增汇总列

在数据分析页面点击新增汇总列,在弹出的页面中设置新增列的列名,选择分组字段为价格范围字段,选择汇总字段为评分,选择汇总方式为平均,并点击确定,如下图所示。
在这里插入图片描述

确定之后,可在下方数据中看到价格范围的平均评分字段及数据,如下图所示。

在这里插入图片描述

9.4 分组汇总

点击分组汇总,拖动价格范围、价格范围的平均评分分组处,拖动价格范围汇总处,并双击汇总处的名称修改为图书数量,选择汇总方式为记录个数,如下图所示。

在这里插入图片描述

9.5 拆分列并排序

把价格范围的第一个数据拆分出来,步骤如下图所示。

在这里插入图片描述

更改价格范围-1字段为index,更新index字段的数据类型为数值,并根据index字段进行升序排序,处理后的数据如下图所示。

在这里插入图片描述

9.6 重命名

修改处理后数据价格与评分关系分析,如下图所示。

在这里插入图片描述

保存分析后的数据,点击右上角保存,如下图所示。

在这里插入图片描述

9.7 查看分析结果

返回我的分析页面,进行数据更新,步骤如下图所示。

在这里插入图片描述

更新数据后,可以看到价格与评分关系分析的结果数据,如下图所示。

在这里插入图片描述

10. 价格与评分人数关系分析

分析不同价格段图书的评分人数差异(如低价书是否更多人参与评分),判断读者对“高/低价书”的评价意愿,为营销推广提供方向(如聚焦低价书的口碑传播)。

10.1 选择数据

此处选择对处理后的数据进行分析,在选择数据页面选择我的分析中的数据处理中的处理后数据,并点击确定,如下图所示。

在这里插入图片描述

10.2 新增赋值列

在数据分析页面点击新增赋值列,在弹出的页面中设置新增列的列名,选择赋值依据字段为图书价格字段,选择分组赋值方式为自定义,根据价格范围设置6个分组,如果有不在分组中的值则分组到其他,并点击确定,如下图所示。

在这里插入图片描述

确定之后,可在下方数据中看到价格范围字段及数据,如下图所示。

在这里插入图片描述

10.3 新增汇总列

在数据分析页面点击新增汇总列,在弹出的页面中设置新增列的列名为平均评分人数,选择分组字段为评分人数字段,选择汇总字段为评分人数,选择汇总方式为平均,并点击确定,如下图所示。

在这里插入图片描述

确定之后,可在下方数据中看到平均评分人数字段及数据,如下图所示。

在这里插入图片描述

10.4 分组汇总

点击分组汇总,拖动价格范围、平均评分人数分组处,拖动价格范围汇总处,并双击汇总处的名称修改为图书数量,选择汇总方式为记录个数,如下图所示。

在这里插入图片描述

10.5 拆分列并排序

把价格范围的第一个数据拆分出来,步骤如下图所示。

在这里插入图片描述

更改价格范围-1字段为index,更新index字段的数据类型为数值,并根据index字段进行升序排序,处理后的数据如下图所示。

在这里插入图片描述

10.6 重命名

修改处理后数据价格与评分人数关系分析,如下图所示。

在这里插入图片描述

保存分析后的数据,点击右上角保存,如下图所示。

在这里插入图片描述

10.7 查看分析结果

返回我的分析页面,进行数据更新,步骤如下图所示。

在这里插入图片描述

更新数据后,可以看到价格与评分人数关系分析的结果数据,如下图所示。

在这里插入图片描述

11. 作者图书数量及评分分析

统计作者(含合著)的出书频次,识别“高产作者”(如某作者出版 5 本以上),分析作者的创作活跃度,为作者合作、内容策划(如系列图书开发)提供线索。

计算作者的平均评分,筛选“高口碑作者”(如平均评分 ≥ 4.5 分),为优质内容推荐、作者签约合作提供依据,同时识别“口碑波动大”的作者,优化内容筛选标准。

11.1 选择数据

此处选择对处理后的数据进行分析,在选择数据页面选择我的分析中的数据处理中的处理后数据,并点击确定,如下图所示。

在这里插入图片描述

11.2 拆分作者列

把作者的第一个数据拆分出来,步骤如下图所示。

在这里插入图片描述

11.3 分组汇总

点击分组汇总,拖动作者-1分组汇总处,拖动评分汇总处,并双击汇总处的名称修改为图书数量,选择图书数量的汇总方式为记录个数,选择平均评分的汇总方式为平均,如下图所示。

在这里插入图片描述

11.4 排序

根据图书数量进行降序排序,步骤如下图所示。

在这里插入图片描述

11.5 重命名

双击处理后数据修改为作者图书数量分析,如下图所示。

在这里插入图片描述

保存分析后的数据,点击右上角保存,如下图所示。

在这里插入图片描述

11.6 查看分析结果

返回我的分析页面,进行数据更新,步骤如下图所示。

在这里插入图片描述

更新数据后,可以看到作者图书数量分析的结果数据,如下图所示。

在这里插入图片描述

12. 最受欢迎的图书分析

通过“高评分 + 高评分人数”双维度筛选,定位数据集中的“爆款图书”。

12.1 选择数据

此处选择对处理后的数据进行分析,在选择数据页面选择我的分析中的数据处理中的处理后数据,并点击确定,如下图所示。

在这里插入图片描述

12.2 字段设置

设置字段只显示书名评分评分人数,如下图所示。

在这里插入图片描述

12.3 过滤

筛选出评分大于4.8且评分人数大于5000的图书,如下图所示。

在这里插入图片描述

12.4 排序

根据评分人数进行降序排序,步骤如下图所示。

在这里插入图片描述

12.5 重命名

双击处理后数据修改为最受欢迎的图书分析,如下图所示。

在这里插入图片描述

保存分析后的数据,点击右上角保存,如下图所示。

在这里插入图片描述

12.6 查看分析结果

返回我的分析页面,进行数据更新,步骤如下图所示。

在这里插入图片描述

更新数据后,可以看到最受欢迎的图书分析的结果数据,如下图所示。

在这里插入图片描述