文章目录
一、数据处理
1. 新建分析文件夹
在我的分析中新建图书文件夹,用于存储分析主题,如下图所示。
2. 新建分析主题
选中图书目录,点击新建分析主题,如下图所示。
在选择数据页面选择books数据,并点击确定,如下图所示。
在显示的数据页面点击保存后,关闭此网页,如下图所示。
返回分析主题可以看到对应数据,如下图所示。
把分析主题重命名为数据处理,如下图所示。
3. 重复值处理
在 FineBI 中,重复值删除(删除重复行)作为数据清洗环节实用功能,用于解决数据集中重复记录问题,保障分析数据唯一性。其去重规则包含两种:一是全字段去重,即勾选 “全选字段” 后,系统对比每一行所有字段值,仅当所有字段内容完全一致时,判定为重复行;二是部分字段去重,适用于更灵活场景,可指定特定字段(如 “书名 + 出版社 + 出版年份” ),只要这些字段组合的值重复,就判定为重复行 。
点击编辑后会进入数据编辑页面,编辑按钮位置如下图所示。
数据编辑页面如下图所示。
点击删除重复行,选择需要进行去重的字段,此处选择书名(只要书名重复则删除整行),如下图所示。
处理之后点击右上角保存更新数据,如下图所示。
4. 字段设置
字段设置用于选择字段、修改字段名称和设置数据类型;在FineBI中,数据类型分为三种(文本、数值、日期),表示的符号如下图所示。
修改字段名称:把价格字段修改为图书价格。点击字段设置,找到价格字段并双击即可进行字段修改,如下图所示。
选择字段:不显示图书ID字段。在字段设置中,找到图书ID字段并取消前面的选中,如下图所示。
设置数据类型:把图书价格字段设置为数值类型。在字段设置中,找到图书价格字段并设置数据类型为数值,如下图所示。
处理之后点击右上角保存更新数据。
5. 过滤
在FineBI中,过滤分为条件过滤和公式过滤,且可以添加多个过滤,设置多个过滤之间是且连接还是或连接,过滤选择如下图所示。
5.1 条件过滤
在 FineBI 的数据处理流程里,条件过滤功能针对不同字段类型,提供了精细化的筛选逻辑,具体可分为文本过滤、数值过滤与日期过滤三类场景:
文本字段过滤:当处理如名称、描述等文本型数据时,支持 10 种筛选条件:「属于、不属于、包含、不包含、为空、非空、开头是、开头不是、结尾是、结尾不是」
数值字段过滤:数值型数据覆盖 12 种筛选逻辑:「介于、不介于、等于、不等于、大于、小于、大于等于、小于等于、最大的 N 个、最小的 N 个、为空、非空」
日期字段过滤:提供 10 种时间筛选规则:「属于、不属于、某个日期之前、某个日期之后、等于、不等于、日期最早的 N 个、日期最晚的 N 个、为空、非空」
示例:过滤出图书名非空且图书价格大于0并小于500的所有数据,步骤如下图所示。
处理之后点击右上角保存更新数据。
5.2 公式过滤
FineBI的公式过滤支持通过自定义计算逻辑对表字段进行条件筛选,具备以下核心特性:
灵活计算能力:可组合使用基础运算符号(加+、减-、乘×、除÷、括号())及内置函数,针对数值、文本等字段构建复杂过滤条件。
智能校验机制:输入公式时系统实时检测语法合法性,自动提示括号不匹配、函数参数错误等问题,降低操作门槛。
跨字段关联过滤:支持引用多字段进行组合计算,如通过
(评分人数 / 出版年份) > 100
筛选高人气新书,满足业务场景下的深度数据筛选需求。
公式过滤部分截图如下图所示。
6. 重命名
修改books为处理后数据,如下图所示。
修改完成后,点击右上角保存,并关闭网页。
二、数据分析
1. 评分分布分析
清晰呈现图书评分的整体分布形态(如评分集中在 3 - 4 分区间,还是 4 - 5 分区间),判断数据集中图书质量的整体口碑,识别评分异常值(极低或极高评分),为后续筛选优质/待优化图书提供基础依据。
1.1 新建分析主题
选中图书目录,点击新建分析主题,如下图所示。
1.2 选择数据
此处选择对处理后的数据进行分析,在选择数据页面选择我的分析中的数据处理中的处理后数据,并点击确定,如下图所示。
1.3 新增赋值列
在分析主题页面点击新增赋值列,在弹出的页面中设置新增列的列名,选择赋值依据字段为评分字段,选择分组赋值方式为自定义,根据评分范围设置5个分组,如果有不在分组中的值则分组到其他,并点击确定,如下图所示。
确定之后,可在下方数据中看到评分范围字段及数据,如下图所示。
1.4 分组汇总
点击分组汇总,拖动评分范围到分组和汇总处,并双击汇总处的名称修改为图书数量,选择汇总方式为记录个数,如下图所示。
1.5 重命名
修改处理后数据为评分分布分析,如下图所示。
双击左上角的分析主题修改为数据分析,然后点击保存,如下图所示。
1.6 查看分析结果
返回我的分析页面,进行数据更新,步骤如下图所示。
更新数据后,可以看到评分分布分析的结果数据,如下图所示。
2. 价格分布分析
统计图书价格在不同区间的数量占比,明确数据集中“低价书、中价书、高价书”的分布结构,辅助采购/定价策略(如判断目标用户对价格的接受偏好)。
2.1 选择数据
此处选择对处理后的数据进行分析,在选择数据页面选择我的分析中的数据处理中的处理后数据,并点击确定,如下图所示。
2.2 条件标签列
在分析主题页面点击条件标签列,在弹出的页面中设置条件标签列名为价格范围,并添加6个标签,依次设置每个标签的显示文本,然后添加条件、选择字段图书价格、设置对应的价格范围,并点击确定,如下图所示。
确定之后,可在下方数据中看到价格范围字段及数据,如下图所示。
2.3 分组汇总
点击分组汇总,拖动价格范围到分组和汇总处,并双击汇总处的名称修改为图书数量,选择汇总方式为记录个数,如下图所示。
2.4 重命名
修改处理后数据为价格分布分析,如下图所示。
保存分析后的数据,点击右上角保存,如下图所示。
2.5 查看分析结果
返回我的分析页面,进行数据更新,步骤如下图所示。
更新数据后,可以看到价格分布分析的结果数据,如下图所示。
3. 出版社图书数量统计分析
量化各出版社的图书出版规模,识别数据集中的“主力出版社”(如人民文学出版社、中信出版社的出书量),分析出版资源的市场集中度,为合作优先级、资源投入方向提供参考。
3.1 选择数据
此处选择对处理后的数据进行分析,在选择数据页面选择我的分析中的数据处理中的处理后数据,并点击确定,如下图所示。
3.2 分组汇总
点击分组汇总,拖动出版社到分组和汇总处,并双击汇总处的名称修改为图书数量,选择汇总方式为记录个数,如下图所示。
3.3 重命名
修改处理后数据为**出版社图书数量统计分析 **,如下图所示。
保存分析后的数据,点击右上角保存,如下图所示。
3.4 查看分析结果
返回我的分析页面,进行数据更新,步骤如下图所示。
更新数据后,可以看到出版社图书数量统计分析的结果数据,如下图所示。
4. 出版社图书评分表现分析
对比不同出版社的平均评分,评估出版社的整体图书质量口碑(如中信出版社 vs 人民文学出版社),筛选“高口碑出版社”,为选品合作、用户推荐提供依据。
4.1 选择数据
此处选择对处理后的数据进行分析,在选择数据页面选择我的分析中的数据处理中的处理后数据,并点击确定,如下图所示。
4.2 分组汇总
点击分组汇总,拖动出版社到分组处,拖动评分到汇总处,并双击汇总处的名称修改为平均评分,选择汇总方式为平均,如下图所示。
4.3 重命名
修改处理后数据为**出版社图书评分表现分析 **,如下图所示。
保存分析后的数据,点击右上角保存,如下图所示。
4.4 查看分析结果
返回我的分析页面,进行数据更新,步骤如下图所示。
更新数据后,可以看到出版社图书评分表现分析的结果数据,如下图所示。
5. 类别数量分布分析
统计心理学、社会学等类别图书的数量占比,识别数据集中的“热门类别”(如文学类是否占主导),反映市场/数据集的内容倾向,辅助内容采购、分类运营。
5.1 选择数据
此处选择对处理后的数据进行分析,在选择数据页面选择我的分析中的数据处理中的处理后数据,并点击确定,如下图所示。
5.2 分组汇总
点击分组汇总,拖动类别到分组和汇总处,并双击汇总处的名称修改为图书数量,选择汇总方式为记录个数,如下图所示。
5.3 重命名
修改处理后数据为类别数量分布分析,如下图所示。
保存分析后的数据,点击右上角保存,如下图所示。
5.4 查看分析结果
返回我的分析页面,进行数据更新,步骤如下图所示。
更新数据后,可以看到类别数量分布分析的结果数据,如下图所示。
6. 类别评分情况分析
对比不同类别图书的平均评分、评分人数,判断读者对各类别的喜好差异(如艺术类 vs 科学类),识别“高口碑但小众”或“低口碑但热门”类别,优化内容推广策略。
6.1 选择数据
此处选择对处理后的数据进行分析,在选择数据页面选择我的分析中的数据处理中的处理后数据,并点击确定,如下图所示。
6.2 分组汇总
点击分组汇总,拖动类别到分组处,拖动评分到汇总处,并双击汇总处的名称修改为平均评分,选择汇总方式为平均,如下图所示。
6.3 重命名
修改处理后数据为类别评分情况分析,如下图所示。
保存分析后的数据,点击右上角保存,如下图所示。
2.5 查看分析结果
返回我的分析页面,进行数据更新,步骤如下图所示。
更新数据后,可以看到类别评分情况分析的结果数据,如下图所示。
7. 价格随时间变化趋势分析
追踪 2000 - 2023 年图书平均价格的变化曲线,识别价格波动节点(如某年份价格骤升/降),关联行业事件(如纸价上涨、电商促销)分析原因,为成本控制、定价预测提供参考。
7.1 选择数据
此处选择对处理后的数据进行分析,在选择数据页面选择我的分析中的数据处理中的处理后数据,并点击确定,如下图所示。
7.2 分组汇总
点击分组汇总,拖动出版年份到分组处,拖动图书价格到汇总处,并双击汇总处的名称修改为平均价格,选择汇总方式为平均,如下图所示。
7.3 排序
根据出版年份进行升序排序,步骤如下图所示。
7.4 重命名
修改处理后数据为价格随时间变化趋势分析,如下图所示。
保存分析后的数据,点击右上角保存,如下图所示。
7.5 查看分析结果
返回我的分析页面,进行数据更新,步骤如下图所示。
更新数据后,可以看到价格随时间变化趋势分析的结果数据,如下图所示。
8. 评分随时间变化趋势分析
观察不同年份出版图书的平均评分走势,判断“新书是否评分更高”“某些年份是否存在质量波动”,关联出版政策、市场环境变化,为选题质量把控提供依据。
8.1 选择数据
此处选择对处理后的数据进行分析,在选择数据页面选择我的分析中的数据处理中的处理后数据,并点击确定,如下图所示。
8.2 分组汇总
点击分组汇总,拖动出版年份到分组处,拖动评分到汇总处,选择汇总方式为平均,如下图所示。
8.3 排序
根据出版年份进行升序排序,步骤如下图所示。
8.4 评分保留一位小数
把评分四舍五入保留一位小数,点击新增公式列,输入列名为平均评分,点击ROUND函数并设置评分保留一位小数,然后点击确定,步骤如下图所示。
设置不显示评分字段,点击字段设置,取消评分字段的勾选,步骤如下图所示。
8.5 重命名
修改处理后数据为评分随时间变化趋势分析,如下图所示。
保存分析后的数据,点击右上角保存,如下图所示。
8.6 查看分析结果
返回我的分析页面,进行数据更新,步骤如下图所示。
更新数据后,可以看到评分随时间变化趋势分析的结果数据,如下图所示。
9. 价格与评分关系分析
验证“价格越高,评分是否越高”的假设,通过价格区间(如 50 元以下 vs 100 元以上)与平均评分的关联,判断价格对读者评价的影响,辅助定价策略优化(如高价书是否需匹配更高质量)。
9.1 选择数据
此处选择对处理后的数据进行分析,在选择数据页面选择我的分析中的数据处理中的处理后数据,并点击确定,如下图所示。
9.2 新增赋值列
在数据分析页面点击新增赋值列,在弹出的页面中设置新增列的列名,选择赋值依据字段为图书价格字段,选择分组赋值方式为自定义,根据价格范围设置6个分组,如果有不在分组中的值则分组到其他,并点击确定,如下图所示。
确定之后,可在下方数据中看到价格范围字段及数据,如下图所示。
9.3 新增汇总列
在数据分析页面点击新增汇总列,在弹出的页面中设置新增列的列名,选择分组字段为价格范围字段,选择汇总字段为评分,选择汇总方式为平均,并点击确定,如下图所示。
确定之后,可在下方数据中看到价格范围的平均评分字段及数据,如下图所示。
9.4 分组汇总
点击分组汇总,拖动价格范围、价格范围的平均评分到分组处,拖动价格范围到汇总处,并双击汇总处的名称修改为图书数量,选择汇总方式为记录个数,如下图所示。
9.5 拆分列并排序
把价格范围的第一个数据拆分出来,步骤如下图所示。
更改价格范围-1字段为index,更新index字段的数据类型为数值,并根据index字段进行升序排序,处理后的数据如下图所示。
9.6 重命名
修改处理后数据为价格与评分关系分析,如下图所示。
保存分析后的数据,点击右上角保存,如下图所示。
9.7 查看分析结果
返回我的分析页面,进行数据更新,步骤如下图所示。
更新数据后,可以看到价格与评分关系分析的结果数据,如下图所示。
10. 价格与评分人数关系分析
分析不同价格段图书的评分人数差异(如低价书是否更多人参与评分),判断读者对“高/低价书”的评价意愿,为营销推广提供方向(如聚焦低价书的口碑传播)。
10.1 选择数据
此处选择对处理后的数据进行分析,在选择数据页面选择我的分析中的数据处理中的处理后数据,并点击确定,如下图所示。
10.2 新增赋值列
在数据分析页面点击新增赋值列,在弹出的页面中设置新增列的列名,选择赋值依据字段为图书价格字段,选择分组赋值方式为自定义,根据价格范围设置6个分组,如果有不在分组中的值则分组到其他,并点击确定,如下图所示。
确定之后,可在下方数据中看到价格范围字段及数据,如下图所示。
10.3 新增汇总列
在数据分析页面点击新增汇总列,在弹出的页面中设置新增列的列名为平均评分人数,选择分组字段为评分人数字段,选择汇总字段为评分人数,选择汇总方式为平均,并点击确定,如下图所示。
确定之后,可在下方数据中看到平均评分人数字段及数据,如下图所示。
10.4 分组汇总
点击分组汇总,拖动价格范围、平均评分人数到分组处,拖动价格范围到汇总处,并双击汇总处的名称修改为图书数量,选择汇总方式为记录个数,如下图所示。
10.5 拆分列并排序
把价格范围的第一个数据拆分出来,步骤如下图所示。
更改价格范围-1字段为index,更新index字段的数据类型为数值,并根据index字段进行升序排序,处理后的数据如下图所示。
10.6 重命名
修改处理后数据为价格与评分人数关系分析,如下图所示。
保存分析后的数据,点击右上角保存,如下图所示。
10.7 查看分析结果
返回我的分析页面,进行数据更新,步骤如下图所示。
更新数据后,可以看到价格与评分人数关系分析的结果数据,如下图所示。
11. 作者图书数量及评分分析
统计作者(含合著)的出书频次,识别“高产作者”(如某作者出版 5 本以上),分析作者的创作活跃度,为作者合作、内容策划(如系列图书开发)提供线索。
计算作者的平均评分,筛选“高口碑作者”(如平均评分 ≥ 4.5 分),为优质内容推荐、作者签约合作提供依据,同时识别“口碑波动大”的作者,优化内容筛选标准。
11.1 选择数据
此处选择对处理后的数据进行分析,在选择数据页面选择我的分析中的数据处理中的处理后数据,并点击确定,如下图所示。
11.2 拆分作者列
把作者的第一个数据拆分出来,步骤如下图所示。
11.3 分组汇总
点击分组汇总,拖动作者-1到分组和汇总处,拖动评分到汇总处,并双击汇总处的名称修改为图书数量,选择图书数量的汇总方式为记录个数,选择平均评分的汇总方式为平均,如下图所示。
11.4 排序
根据图书数量进行降序排序,步骤如下图所示。
11.5 重命名
双击处理后数据修改为作者图书数量分析,如下图所示。
保存分析后的数据,点击右上角保存,如下图所示。
11.6 查看分析结果
返回我的分析页面,进行数据更新,步骤如下图所示。
更新数据后,可以看到作者图书数量分析的结果数据,如下图所示。
12. 最受欢迎的图书分析
通过“高评分 + 高评分人数”双维度筛选,定位数据集中的“爆款图书”。
12.1 选择数据
此处选择对处理后的数据进行分析,在选择数据页面选择我的分析中的数据处理中的处理后数据,并点击确定,如下图所示。
12.2 字段设置
设置字段只显示书名、评分和评分人数,如下图所示。
12.3 过滤
筛选出评分大于4.8且评分人数大于5000的图书,如下图所示。
12.4 排序
根据评分人数进行降序排序,步骤如下图所示。
12.5 重命名
双击处理后数据修改为最受欢迎的图书分析,如下图所示。
保存分析后的数据,点击右上角保存,如下图所示。
12.6 查看分析结果
返回我的分析页面,进行数据更新,步骤如下图所示。
更新数据后,可以看到最受欢迎的图书分析的结果数据,如下图所示。