数据分析入门知识

大数据
后台-插件-广告管理-内容页头部广告(手机)

今天不说模板,说说数据分析的入门知识,与大家共享。数据分析是最近很火的知识,似乎是非常新的东西,其实并非是新概念。根据百度百科,数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。数据分析的数学基础在20世纪早期就已确立,但直到计算机的出现才使得实际操作成为可能,并使得数据分析得以推广。数据分析是数学与计算机科学相结合的产物。

最近数据分析火热的原因有三个:

第一,大数据有了。足够多的数据使得原有基于统计、抽样的统计方法的局限性显现,新的分析需求出现。

第二,分析能力的提升。近年来信息技术的飞速发展,使得数据分析能力提升巨大,大家有了更多研究的资源。

第三,长尾效应催生需求。互联网经济的理论基石之一就是长尾效应,大量低销量产品可以产生总体巨大的销量,使得营销需要更加个性化,而由于成本原因,人工进行个性化营销是不可接受的,通过数据分析可以实现低成本的个性化营销。

那么,做数据分析需要什么呢?我认为需要以下三方面。

首先是需要基本的统计知识。数据分析是以统计知识为基础的,即便是所谓大数据分析(实际上大部分是大数据统计)也是基于经典统计理论进行扩展而来的,其扩展主要也是从技术上适应现有数据结构和分析工具,所以踏踏实实买本统计学教材吧,不需要你学的多深,但基本的知识体系还是需要建立的

其次是需要掌握基本的分析工具。一般而言,对于非IT人士,入门的分析工具我还是推荐MS office excel,excel内置的模块可以实现基本的数据分析功能,如果能学会VBA更好,不会也无妨,能熟练应用excel后再去学习SPSS,R,Python就会容易很多,因为基本的使用思想是接近的。对于IT人士,其实最基本是就是excel和SQL,不要看不起SQL,80%的分析用SQL就可以实现,甚至可以直接训练模型,我自己比较喜欢用postgresql\greenplum数据的Madlib开源数据分析库,直接用SQL在数据库上训练模型。

最后是需要对分析对象的业务有了解。任何的数据分析都是基于对分析对象的了解而进行的,很多事物在数据分析看来是相关的,但实际上可能只是巧合,这也是数据分析师最难的地方之一,当然也是数据分析师不是吃青春饭的重要原因之一。对业务的了解是需要耐心和时间的,透彻的理解可以大大提高数据分析的效果。

后台-插件-广告管理-内容页尾部广告(手机)
标签:

评论留言

我要留言

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。