一、大数据如何获得?如何统计分析?
从数据源角度,可以将大数据统计工具分两类:有数据源和无数据源。
有数据源解释:依靠海量网络数据为数据源,整理呈现分析最终展现出来给你看的统计工具。
此类工具包括:
百度指数:以百度海量网民行为数据为基础的数据分享平台:
5118:可掌控一些大网站运营所需的关键数据(如今日头条)
阿里指数:电商必备的行业价格、供应、采购趋势分析工具
其他还包括微信指数/搜狗指数/360指数/微指数……
无数据源解释:工具本身是不带数据源的,需要企业根据需要去导入数据。
此类工具包括:
fineBI:新一代自助大数据分析的BI工具,所见所得的自助式数据分析
Tableau:将数据运算与美观的图表嫁接在一起。
大数据的数据来源主要有三个渠道,分别是物联网系统、传统信息处理系统以及互联网应用(Web和App),所以要想获得大数据就要从这三个渠道来获取。
物联网系统产生的数据占据着大数据中的重要比例,物联网产生的数据多以非结构化数据为主,包括视频、音频、传感数据等等。物联网的应用领域众多,比如工业物联网、农业物联网、车联网、智慧城市等都会产生大量的数据,通常情况下这些数据的采集都是有严格要求的,是不能开放给个人的。如果个人要想获得这部分数据,一个比较可行的方案是跟数据采集者进行合作,比如做数据分析等业务。
传统信息系统涵盖的领域非常广泛,有政务系统、企业ERP、教育信息系统、医疗信息系统等等,传统信息系统涵盖的数据多以结构化数据为主,而且往往有较高的精确度和关联关系,这部分数据的价值密度也是相对比较高的。
但是传统信息系统涵盖的数据往往涉及到个人隐私、商业机密等内容,所以这部分内容通常是受到严密保护的。随着大数据技术的发展,业界对于政务系统的数据开放的呼声越来越高,经过脱敏的数据往往并不会对个人隐私构成侵犯,所以未来某些政务系统的大数据会陆续开放出来。
互联网应用也是产生大数据的重要基础之一,包括各种Web应用以及大量的App产品,这部分数据多以半结构化为主,数据内容也存在真假难辨的情况,但是由于这部分数据的价值密度相对还是比较高的,所以现在不少互联网公司就是基于这些数据对用户进行“画像”,从而进行多维度的分类。
至于大数据分析工具,推荐2个给你。
1、FineReport
FineReport是一款纯Java编写的、集数据展示(报表)和数据录入(表单)功能于一身的企业级web报表工具,它“专业、简捷、灵活”的特点和无码理念,仅需简单的拖拽操作便可以设计复杂的中国式报表,搭建数据决策分析系统。
来看看它做的dashboard吧:
很多人看到上述的可视化会好奇,这是什么图表制作的。其实大多由FineReport自带的H5图表。此前有提到FineReport良好的开放性,可让IT同事写代码开发,所以在制作时,也可接入Echarts等第三方控件来制作图表。
2、FineBI
FineBI是新一代自助大数据分析的商业智能产品,提供了从数据准备、自助数据处理、数据分析与挖掘、数据可视化于一体的完整解决方案,也是我比较推崇的可视化工具之一。
首先FineReport作为一款报表工具,主要用于解决提升IT部门的常规/复杂报表开发效率问题;而FineBI是商业智能BI工具,在IT信息部门分类准备好数据业务包的前提下,给与数据,让业务人员或领导自行分析,满足即席数据分析需求,是分析型产品。
FineBI的使用感同Tableau类似,都主张可视化的探索性分析,有点像加强版的数据透视表。上手简单,可视化库丰富。可以充当数据报表的门户,也可以充当各业务分析的平台。
二、统计学中,统计数据来源渠道有哪些?
一、数据的来源
从使用者的角度看,统计数据资料的来源主要有两种渠道:
一种是通过直接的调查或实验获得的原始数据,这是统计数据的直接来源,一般称为原始或第一手统计数据。
另一种是别人调查的数据,并将这些数据进行加工和汇总后公布的数据,通常称为次级数据或第二手间接的统计数据。一切间接的统计数据都是从原始的、第一手数据过渡而来的。
二、数据的直接来源——原始数据
搜集数据最基本的形式就是进行统计调查或进行实验活动,统计调查或进行实验就是统计数据的直接来源。
1、统计调查
统计调查是指根据统计研究预定的目的、要求和任务,运用科学的方法,有计划、有组织地向客观实际搜集资料的过程。通过统计调查得到的数据,一般称为观测数据。
2、实验法
实验法是直接获得统计数据的又一重要来源。通过实验法得到的数据就是实验数据。
三、数据的间接来源有:
1、公开出版的统计数据。
主要来自官方的统计部门和政府、组织、学校、科研机构。
2、尚未公开发表的统计数据。
如各企业的经营报表数据、专业调查咨询机构为公开发布的调查结果数据。
需注意的是,如果公开引用未公开发表的数据需要征得数据所有者的同意,同时要为自己发布的数据负责。
三、统计数据可分为哪几种类型不同类型的统计数据各有什么特点?
统计数据按不同的分类规则可分为不同的类型,这里主要按三种分类规则分类:
1.按照所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。
2.按照统计数据的收集方法,可以将其分为观测数据和实验数据。
3.按照被描述的对象与时间的关系,可以将统计数据分为截面数据和时间序列数据。
不同类型的统计数据的特点:
1.分类数据
只能归于某一类别的非数字型数据,比如性别中的男女就是分类数据。
2.顺序数据
只能归于某一有序类别的非数字型数据,比如产品的等级。
3.数值型数据
按数字尺度测量的观察值,它是自然或度量衡单位对事物进行测量的结果。
4.观测数据
通过调查或观测而收集到的数据,它是在没有对事物进行人为控制的条件下得到的,有关社会经济现象的统计数据几乎都是观测数据。
5.实验数据
在实验中控制实验对象而收集到的数据则称为实验数据。
6.截面数据
在相同或近似相同的时间点上收集到的数据称为截面数据。
7.序列数据
在不同时间上收集到的数据,称为时间序列数据。
扩展资料
统计数据是统计工作活动过程中所取得的反映国民经济和社会现象的数字资料以及与之相联系的其他资料的总称。是表示某一地理区域自然经济要素特征、规模,结构、水平等指标的数据。是定性、定位和定量统计分析的基础数据。