期刊信息
曾用名:现代图书情报技术;计算机与图书馆
主办:中国科学院文献情报中心
主管:中国科学院
ISSN:2096-3467
CN:10-1478/G2
语言:中文
周期:月刊
影响因子:0.912234
数据库收录:
北大核心期刊(2004版);北大核心期刊(2008版);北大核心期刊(2011版);北大核心期刊(2017版);中国科学引文数据库(2017-2018);中国科学引文数据库(2019-2020);中文社会科学引文索引-来源(2017-2018);中文社会科学引文索引-来源(2019-2020);国家哲学社会科学学术期刊数据库;中国人文社科核心期刊;中国科技核心期刊;期刊分类:图书情报与数字图书馆
期刊热词:
研究论文
思考:数据分析与数据后台设计(3)
【作者】网站采编
【关键词】
【摘要】以上两个例子分别代表了聚焦于某天内多个影响因素以及聚焦于长时间多个影响因素的观察行为,对于不同的观察数据行为,在数据的呈现以及表现上也有
以上两个例子分别代表了聚焦于某天内多个影响因素以及聚焦于长时间多个影响因素的观察行为,对于不同的观察数据行为,在数据的呈现以及表现上也有不同。
观察的关键则在于让我知道,问题是什么。
三、分析
最后到了分析数据环节。
我并没有讲分析数据的方法或者工具的打算,本文的目的依然是分享一些我的数据分析思路以及根据思路而衍生的数据后台设计经验,通过思路可以帮助大家思考找到解决问题的方向与启发。所以在分析数据这个环节依然谈的还是从监控到观察最后到分析这个过程的一些看法。
当我们观察数据以后,此时脑海中已经收获了不少的信息,将这些信息进行整合根据目标进行思考的过程我称之为分析。
分析的目的与意义在于发现问题或者是验证结论,这是两件事。如果目标是发现问题,那么从众多的数据指标中、从多维度多角度的数据中发现问题,是一个主动且存在未知性的行为。而如果目标是验证结论,那么问题是清晰的,我们需要的是从数据中找到证据,这是一个相对被动且已知的行为。
当问题已知的情况下,不论是找到问题的影响因素还是已知影响因素来确认对问题的影响,都已经有了非常明确的目标,此时分析数据的意义就是找到支撑问题解决方法的依据或是解决方法的思路。
因为分析数据的目标在于找到解决方法,所以分析数据时对于数据的要求比观察数据更高,根据分析数据的行为,要求更为直接:
- 足够的数据指标作为基础用于分析;
- 足量的数据(时间粒度、时间长度)作为依据;
- 使用一定的科学方法得出合理结论。
足够的指标以及足量的数据是为了保证在使用分析方法时有足够的内容得出客观的结论,否则在缺少支持的情况得出的结论依然值得质疑。
分析这个环节考验的是分析者对于数据的掌握程度、对于问题的明确程度以及对于分析方法的了解程度。很多时候不必过于偏重于方法的账号,对于日常中的很多问题,对问题的理解到位加上对于数据的高度理解加上简单的方法也可以得出有效的结论。
分析方法建立在对于统计学、概率统计等数据科学的基础上,不在结合问题与目标的基础上盲目追求掌握方法,并不会对数据分析有太好的帮助。缺乏监控和观察的过程,直接拿到数据也未必能有合理的判断,因为缺少长时间观察监控数据造成对数据的理解,很容易被先入为主的想法影响从发现问题变成验证先入为主的想法。分析的过程已经脱离了数据后台,此时需要靠扎实的态度与数据科学知识帮助自己。
结合分析这部分,我仅以我个人的经验总结了几条数据分析与数据后台的想法:
- 通过多种监控来观察数据,通过观察数据得出分析思路,通过分析得出结论;
- 看数据的不同行为,提升效率的方式不同,需要后台提供不同的功能来满足;
- 后台更多的是为监控和观察提高效率,分析依赖于数据分析者本身的主观行为、能力。
最后还想分享的是,多学、多讨论,数据分析这件事通过讨论交流得来的知识与信息,往往比掌握一个看似高端而不常用的分析方法来的实在。
分析的关键在于让我知道,该做什么。
第二大部分谈谈数据后台的设计思路。
在了解了数据分析的过程以及各过程的目标、关键至后,针对不同过程,数据后台在功能的支持上也有针对性与特殊性。
在监控数据与观察数据过程中,后台可以通过图、表格高效的展示数据,帮助分析者在看数据时思考获取信息,而分析数据则需要分析者脱离后台的限制根据目标问题进行分析,此时便已经脱离后台了。可以说数据后台奠定了分析数据的基石,因为所有思考分析都来源于数据后台的每一个指标、每一张图以及每一个表格,分析过程依赖于分析者而非后台。
如今的数据类产品已经发展成为监控观察以后台为主,分析思考以工具为主的模式。数据后台提供的是原材料,而像PowerBI、FineBI以及tableau这样的商业智能工具成为了分析数据的利器。数据后台更多在于满足监控与观察,而对于分析过程而言便捷的提供数据获取功能即可,之后的事情则需要交给具有强大分析功能的各类工具。
那么还是从监控数据开始。
在前文举例说明监控数据的要求时,游戏的同时在线人数与阿里云SLB监控两个例子突出了可视化图、细时间粒度的特点,但这只是针对了范围很小的一些数据指标。
文章来源:《数据分析与知识发现》 网址: http://www.sjfxyzsfx.cn/zonghexinwen/2021/0907/1445.html
上一篇:《十件古物中的丝路文明史》璀璨丝路文明里,
下一篇:一文读懂业务数据的分析思路