本文共 2422 字,大约阅读时间需要 8 分钟。
数据、信息和知识被广泛的用于计算机科学领域。
数据是信息的载体,信息是数据的语义解释。数据是得出结论的前提。信息是处理后的数据,为实际问题提供答案。
当我们增加一种关系或者一个关联时,数据就成为信息。这种关联通过提供数据背景来完成。这各背景有助于我们回答数据相关的问题。
数据有很多种表现形式,例如:
知识是数据、信息通过经验获得的技能。知识包括做出适当决策的能力和执行时所需的技能。
收集数据的目的是为了进一步分析数据中隐藏的特征、规律、关联关系等,从而揭示数据背后隐藏的真相。为了基于已有数据信息得到最佳或者现实的决策,数据分析就尤为重要。
数据需要通过收集、处理和组织,才能够用于数据分析。
按数据收集对象包括范围的大小不同,分为全面调查和非全面调查。
按数据收集的登记时间是否连续,分为经常性调查和一次性调查。
按数据收集实施主体的不同,分为政府统计调查和民间统计调查。
数据收集的调查方式 数据收集的调查方式,按照组织方式主要有:普查、抽样调查、典型调查、重点调查和统计报表制度。 普查:专门组织的一次性全面调查。普查的特点:
普查应遵循以下原则:
抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本数据推断总体数量特征的一种非全面调查。
抽样调查优势:经济性、时效性、准确性
几种具体的抽样方式:
第一阶段,将总体分为若干个一级抽样单位,从中抽选若干个一级抽样单位入样;
第二阶段,将入样的每个一级单位分成若干个二级抽样单位,从入样的每个一级单位中各抽选若干个二级抽样单位入样……,依此类推,直到获得最终样本典型调查
从调查对象的全部单位中选择少数典型单位进行调查。目的是描述和揭示事物的本质特征和规律。
调查结果不能用于推断总体。
重点调查
从调查对象的全部单位中选择少数重点单位进行调查。调查结果不能用于推断总体。
统计报表制度
按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级填报的一种调查组织方式。
统计报表内容:报表目录、报表表式、填表说明 统计报表的资料来源:原始记录、统计台账、企业内部报表数据收集的方法
优点:广泛地认识客观现象、深入地研究问题、资料收集可靠和应用面很广
缺点:必须依赖具有较高素质的访问员、直接交谈会对获取资料的客观性产生负面影响、在不便询问时访谈无法实施、调查费用大、时间长,可能会碰到意料不到的困难
集体访谈:将一组被调查者集中在调查现场,让他们对调查的主题发表意见以获得资料
常用的有:头脑风暴法、德尔非法(专家意见法)、深度访谈法
个别访谈:调查者对每一名受访者进行一对一单独访谈。
就调查对象的行动和意识,调查人员边观察边记录以收集所需信息
调查人员不是强行介入
能够在被调查者不察觉的情况下获得资料
在实验中控制一个或者多个变量,在有控制条件下得到观测结果。
实验不仅是收集数据的一种方式,而且是一种研究方法。
在设定的特殊实验场所、特殊状态下,对调查对象进行实验以获得所需资料。有室内实验法和市场实验法。
数据的误差是指通过调查搜集到的数据与研究对象真实结果之间的差异。
数据的误差有两类:抽样误差和非抽样误差。
抽样误差是由抽样的随机性引起的样本结果与总体真值之间的差异。
非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由其它原因引起的样本观察结果与总体真值之间的差异。
抽样误差是一种随机性误差,只存在于概率抽样中;非抽样误差则不同,无论是概率抽样、非概率抽样,还是在全面调查中,都有可能产生非抽样误差。
转载地址:http://qsvdi.baihongyu.com/