数据分析之数据解读

发布于:2022-12-15 ⋅ 阅读:(703) ⋅ 点赞:(0)

        作为数据分析师,不仅要具备主导、执行数据分析任务,还要能解读数据,从内外数据中提取有价值、感兴趣的内容,鉴别真伪、对错等。同时解读别人的数据,对我们自身分析报告的撰写也是有益的。今天是2022年9月16日,(国家统计局 (stats.gov.cn))公布2022年1-8月的能源、消费、房地产等众多数据,以此为例,聊一聊数据解读,与数据说话。

1.数据解读——结论优先

        以国家统计局发布的2022年8月份能源生产情况 (stats.gov.cn)为例,报告第一句(如下图)为整体总结,简单几十个字清晰描述报告内容:1-8月原煤、天然气保持增长但增速放缓,原油下降,发电量大幅增加。这样的总结性分析描述,以金字塔原理来讲遵循“结论优先”,为整份报告定调,同时对于不想细读的人,定性陈诉分析结论。

         我们在自己撰写分析报告、设计数据看板时,也要注意:结论优先,先宏观整体,再分层次结构,并展现长短期趋势,图表结合,对典型数据要加以提及,最后根据实际情况附上明细、注释注解让不同层次级别的阅读者能直观、准确、高效、形象的了解想表达的内容。

2.数据解读——读懂数据

2.1 数据的描述对象是谁?

        进入社会与职场,要明白一点:描述用词一定要准确严谨、少歧义。例如描述对象(或指标):明白煤炭说的是动力煤、工业煤还是全部?同比还是环比?成交额是否包含退款?等等。

        总结说就是:1.明确统一实体描述定义,减少主观的理解与重复沟通;2.明确统一计算口径,包括计算范围、周期、结构组成、异常处理等。

2.2 读懂专业名词、描述习惯、人为障碍

举例: 单位的不一致

        如下图:

咋看好像我国进口天然气 7105万1437亿 的自产完全不是一个量级(谢天谢地不用像欧洲人民忍受天价天然气),但细看两者单位不一样,进口用 “吨” 而自产用 立方米如果不细看数据单位,则会产生错误理解并下错误结论“当前我国天然气完全不需要进口”。需要进行单位换算(也就是对分析报告进行二次加工分析)(不懂是行业习惯还是有意制造理解上的偏差、甚至故意让人产生误解,毕竟天然气全球恐慌)。1吨天然气=1380立方米,这些就需要点专业知识,更重要是细心。7105万吨=980.49亿立方米,进口与自产比例:980.49:1437=0.68:1,这时得出的结论就应该是:我国天然气进口量占自产的约2/3,即约40%的天然气消费来自进口。一字之差,结论迥异!

        本报告中还有上述单位不一致情况,例如:自产原煤用亿吨,进口用万吨。(不懂是习惯还是啥,为啥单位就不一致)

2.3 注意图标数据的周期不一致

        如下图:

作为车主饱受油价高企之苦,95油价甚至到了10元。上图数据,咋一看给人的感觉好像是:2022年1、2月原油进口比平常翻了一倍(好家伙,国家真聪明,提前分析到俄罗斯跟乌克兰要打仗,趁油价大涨前先暴力进口囤油)。但实际细看,其实是1-2月的数据合并为1个图柱(因为我国春节因素,1-2月的数据都会有比较大波动),平均下来每个月其实也就4250万吨左右,差别不大,在4000万吨上下浮动。这种合并1-2月数据的操作是国家发布数据常有的,算是报告里的描述习惯吧,解读数据的时候一定要仔细。

 2.4 用好环比与同比来解读变化趋势

        这里先用房价数据来举例更有感觉,如下图:

环比:(本月-上月)/上月*100%,以上月价格为对比基准

同比:(本月-去年本月)/去年本月*100%,以去年同月价格为对比基准

定基比:以2020年为定基,(本月-2020年基价)/2020年基价*100%,从更长远周期看变化。

一般会把环比与同比一同来看,最后看定基,广州为例,8月环比99.9,同比100,说明广州的二手房价格还挺坚挺的,一年了都还没有降(同比100),但似乎有松动下降苗头(环比99.9,其实0.1%可以忽略的),同比环比结合来看,隐藏的意思就是7月的房价同比去年还是上涨的(呵呵);最后看定基,原来啊,这两年以来,房价居然上涨了12.7%,涨了这么多。那得出什么结论呢?广州的房价原来现在抄底,居然还是2020年高12.7%,现在买是不是像极了买股票我们以为下降10%就是谷底,其实还可以下降50%。所以这就是为什么要有长期视角,长周期来看数据,否则短期的波动会带来数据假象,导致错误判断。房价还有得降呢!

        看看其他城市,例如东三省城市,典型的人口流出城市,可以看到如长春、哈尔滨,与2020年相比,只有两年前的90%左右,但环比99,同比97,则表面房价下降速度已经在减缓(因为环比波动1%,同比波动3%,2%左右的大幅下降则来自8月之前,这是一个没有趋势图,只有同环比的情况下判断下降速度的经验方法)。

 2.5 结合大环境其他数据来辅助解读

        2020年的盛夏,是值得铭记的日子。7-8月本应是长江的汛期,不缺少的四川居然长期干旱无雨,重庆的嘉陵江、湖北的长江、洞庭湖、鄱阳湖都快干旱见底,对于长江边长大的我,这是第一次见。而西北的沙漠里, 却出现洪水,真就是沧海变桑田。

        把干旱的新闻与电力生产数据结合起来,水电下降11%,这个就很好理解。这里要强调:很多的数据分析、报告里只描述现状、变化,但没有给出原因。对于分析师而言,要扩展数据与知识,一方面对数据的合理性进行推敲,不人云亦云;另一方面对数据变化背后的原因进行分析,知其然,更要知其所以然,这才是优秀的数据分析师要具备的基本素质。

 再来解读用电量数据,如下图8月份全社会用电量同比增长3.6%---国家能源局 (nea.gov.cn)

         “克强经济学”里三大指标之一:工业用电量是判断经济发展的重要指标。8月第二产业用电量同比增长0.6%,但第一产业增长13.7%,第三产业增长6.2%,从增速结构上看似乎不太合理,但结合8月四川等省份缺电让电于民以及华中大部农业抗旱电力使用情况,就基本能合理解释数据。另外,城乡居民用电同比增长12.5%表明:今年的夏天比以往更热,需要更多电力制冷!(这里如果有分省份的用电量数据,则更能证明,感兴趣自己继续探索)。 如此结合外部数据,对用电量数据也能有很好的解读。

 3. 总结

        解读数据虽相对容易,但也很关键。在陈诉、阅读他人数据报告,要做到几点:

1.清晰准确理解(陈诉),这是深入交流、批判思考的第一步,没有读懂数据的讨论低质量;

2.带着批判的思维、综合知识与外部数据,评估数据是否合理,对数据有多大的信任值;

3.数据背后的原因是什么要主动思考,以及应该采取什么样的措施,并实时的与他人分享。

        如此你一定会成为一名有想法、主动思考、让人刮目相看的数据分析师。

本文含有隐藏内容,请 开通VIP 后查看

网站公告

今日签到

点亮在社区的每一天
去签到