首页 >  常识 > 

普查的概念是什么(统计学名词解释)

发布时间:2024-11-06 08:45:44

01

如何统计某十字路口一天内通过的机动车数量,这时候我们就要用到观测法,通过观测法获得的数据称为观测数据。


观测数据:观测数据(observational data)是对客观现象进行实地观测所取得的数据,在数据取得的过程中一般没有人为的控制和条件约束。在社会经济问题研究中,观测是取得数据最主要的方法。很多社会经济问题不适合应用实验的方法,只能通过实际调查得到数据,用各种调查方法得到的数据都属于观测数据。

02

物理、化学、生物实验室中,老师与同学们经常是通过控制某些条件去验证定理或者收集新的数据信息,我们将通过这种方式获得的数据称为实验数据。


实验数据:实验数据(experimental data)一般是在科学实验环境下取得的数据。在实验中,实验环境是受到严格控制的,数据的产生一定是某一约束条件下的结果。在自然科学研究中实验的方法应用非常普遍,因此,自然科学研究中所用的数据多为实验数据。

03

我们将2024年第一季度陕西省的旅游接待人数、旅游收入,人均花费称为横截面数据。


横截面数据:横截面数据(cross-section data)是在同一时间节点上或同一段时间内所收集的数据,描述多个观测对象在相同一段时间内或相同时间节点上的表现。

04

我国2014年—2024年春节的出游人次称为时间序列数据。


时间序列数据:时间序列数据(time series)是按时间顺序在不同时间段或时点上取得的一系列数据,描述观测对象随着时间变化而变化的情况。

05

我们把从截面和时间序列两个维度考察的数据称为面板数据。如:北京、上海、广州和西安2020、2021、2022、2023年全年的旅游接待人数就是面板数据。


面板数据:面板数据(panel data)是对不同观测对象在不同时间段或时点上所收集的数据,描述多个观测对象随着时间变化而变化的情况。

06

像用户在社交平台上分享的原生文本、图片和视频称为原始数据。


原始数据:通过直接调查或实验获得的原始数据,这是统计数据的直接来源,一般称之为原始数据或一手数据。

07

某高校大学生计划分析研究2024年95和92号汽油价格变化趋势,这时需要搜集2024年之前最近几年的汽油价格变化趋势数据作为参考,我们将2024年之前最近几年的汽油价格变化趋势数据称为次级数据。


次级数据:次级数据(二手数据)是指由其他人搜集和整理得到的统计数据。限于一定的条件,研究者可能无法亲自收集数据,或者已知有些数据已有他人的调查成果,不必再重新再做一次。这时,就需要收集二手资料以满足研究的需要。这种建立在他人调查整理基础上的次级数据也称为数据的间接来源。

08

我国的三项重大国情国力周期性普查分别是经济普查、农业普查和人口普查。


普查:普查(census),是指为某一特定目的而专门组织的一次性的全面调查,用来调查属于一定时点上或一定时期内的社会现象总量。它适于搜集某些不能或不适宜于定期的全面统计报表搜集的统计资料,以摸清重大的国情、国力。

09

某乳制品品牌商家想要了解顾客对该乳制品的满意度情况,通常是通过概率抽样的方法抽查一定的样本进行调查,抽样调查也会产生抽样误差。


抽样调查:抽样调查(sample survey),是一种非全面调查,它是按照一定程序从总体中抽取一部分个体作为样本进行调查,并根据样本调查结果来推断总体特征的数据调查方法。


概率抽样:概率抽样(probability sampling),也称随机抽样(random sampling),是指遵循随机原则进行的抽样,总体中每个个体都有一定的机会被选入样本。从理论上讲,概率抽样是最科学的抽样方法,它能保证抽取出来的样本对总体的代表性。


抽样误差:抽样误差(sampling error),是由于抽取样本的随机性所造成的样本值与总体值之间的差异,也称为代表性误差。抽样调查中之所以会出现这样一种误差是由于样本只是总体的一部分,它对总体的代表性存在局限性,从而会造成误差。在抽样调查中,抽样误差是不可避免的。在概率抽样中,抽样误差是能够计量且可以得到控制的。


标准误差:统计量的标准误差(standard error)也称为标准误,它是指样本统计量分布的标准差。标准误差用于衡量样本统计量的离散程度,在参数估计中,它是用于衡量样本统计量与总体参数之间差距的一个重要尺度。


样本:样本(sample),从总体中抽取的一部分元素构成的集合。同一个总体可以抽取出若干个样本组成集合,样本对于研究者而言是不唯一、不确定的,但是一旦收集到一个样本的数据,其特征就可以通过所收集到的数据刻画出来。因此,样本的特征是已知的。描述样本特征的概括性数字度量称之为样本统计量(statistics),它是根据样本数据计算出来的一些量,是样本的函数。


简单随机抽样:简单随机抽样(simple random sampling)也称纯随机抽样,它是直接从总体中抽选个体,每个个体被选入样本的概率都相等,可分为有放回和无放回两种方式。有放回抽样也称为重复抽样(repeated sampling),在一个个体被选入样本后,记录其编号,然后又将其放回总体中继续参与随后的抽样过程;无放回抽样也称不重复抽样(non-repetitive sampling),在一个个体被选入样本后,不再放回总体中继续参与随后的抽样过程。

分层抽样:分层抽样(stratified sampling)也称类型抽样,它首先将要研究的总体按某种特征或某种规则划分为不同的层(组),然后按照等比例或最优比例的方式从每一层(组)中独立、随机地抽取个体,最后将各层的样本结合起来对总体的目标量进行估计。


整群抽样:整群抽样(cluster sampling),是先将总体分为R个群或子总体,然后按某种方式从中随机抽取r个群,再对抽中的群中所有个体都进行调查的一种抽样方式。


系统抽样:系统抽样(systematic sampling),也称等距抽样。它是将总体N个个体按某种顺序排列,按规则确定一个随机起点,再每隔一定间隔逐个抽取样本单位的抽样方法。典型的系统抽样是先从数字1—k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k,…。


非概率抽样:不满足概率抽样要求的抽样都被归为非概率抽样(non-probability sampling)。非概率抽样没有完全按照随机原则选取样本单位,其中单个单位被选中的概率是不可知的,样本统计量的分布不确定,因而无法计算抽样误差,也无法使用样本的结果对总体相应的参数进行推断。


方便抽样:方便抽样(convenience sampling),也称为便利抽样、偶遇抽样。它主要用于初期评估的探索性研究。调查过程中由调查员依据方便的原则自行确定抽入样本的个体。如,在实施问卷调查过程中,访问员碰人即问或被调查者主动回答问题。方便抽样的优点是容易实施,调查的成本低;缺点是样本的确定带有随意性,样本无法代表有明确定义的总体。


判断抽样:判断抽样(judgment sampling),是调查者根据主观经验和判断从总体中选取有代表性的个体构成样本的一种非概率抽样方法。它不能获得估计值的精度,其精度取决于抽样者的经验,适用于总体中的个体极不相同而样本容量又很小的情况。


配额抽样:配额抽样(quota sampling),类似于概率抽样中的分层抽样,是非概率抽样方法中常用的一种抽样方法。其操作比较简单,而且可以保证总体中不同类别的个体都能包括在所抽的样本中,使得样本结构和总体结构类似。

雪球抽样:雪球抽样(snowball sampling),也称为滚雪球抽样,其原理是先找到最初的样本,然后根据他们提供的信息去获得新的个体形成样本。这种过程不断继续,直到完成规定的样本容量为止。滚雪球抽样往往用于对稀少的特定群体的调查。

10

我们在观看财经频道的时候,经常会看到主持人对应着统计报表报到国家某一年或者某个季度财务状况,那么什么是统计报表呢?


统计报表:统计报表(statistical report forms),是按照国家统一规定的调查要求与文件(指标、表格形式、计算方法等),自上而下地统一布置、自下而上地逐级提供基本统计资料的一种调查方式。

11

如果某个监管部门对存在安全隐患的某些餐馆进行调查,我们将这样的调查称为重点调查。


重点调查:重点调查(survey of main units),是在调查对象中选择一部分重点单位进行的一种非全面调查。重点调查的关键是准确恰当地选取重点样本。选取重点样本时,一般采取系统分析、综合比较的方法,选择对总体能起主要或决定作用的因素。这些重点单位虽然数目不多,但它们具有所研究现象的总量在总体总量中占据绝大部分的特点。

12

当我们帮助一家品牌蛋糕店做顾客满意度调查时,通常是找来在这家店购物的顾客,将他们聚集在一起进行讨论,让他们对调查主题发表意见以获取数据,我们将这样获取数据的方式称为座谈会法。像这样的面对面交谈获取数据的方法也称为称为面访。


座谈会:座谈会(forum)也称集体访谈。是将一组被调查者集中在调查现场,让他们对调查主题发表意见以获得数据,主要用于定性问题的研究。参加座谈会的人数不宜过多,一般为6至10人,并且是有关调查问题的专家或有经验之人。通过座谈会,调查者可以从一组被调查者那里获得所需的资料。而且,在彼此交流的环境中,各个被调查者之间相互影响、相互启发、相互补充,并在座谈过程中不断修正自己的观点,从而有利于取得较为广泛、深入的想法和意见。

面访:面访(interview)是调查者与被调查者通过面对面地交谈,从而得到所需数据的数据搜集方法。面访的方式可分为标准式访问和非标准式访问两种。标准式访问又称为结构式访问,它是按调查人员事先设计好的、有固定格式的标准化问卷或表格,有顺序地依次提问,并由被调查者做出回答。其优点是能够对数据搜集过程加以控制从而获得比较可靠的调查结果;非标准式访问又称为非结构式访问,它事先不制作统一的问卷或表格,没有统一的提问顺序,调查人员只是给题目或提纲,由调查人员和被调查者自由交谈,以获得所需数据。市场调查和社会调查中常采用该种方式进行数据搜集。

013

当我们在帮助客户做购房满意度调查时,我们会联系到购买了该品牌房子的业主面对面交流,向受访者发掘深入的信息,该方法称为深访。


深访:个别深入访谈简称深访(in-depth interview),是一种一次只有一名被调查者参加的特殊的数据搜集方法。调查人员运用大量的追问技巧,尽可能让被调查者自由发挥,不断深入被调查者的思想之中,努力发掘其行为的真实动机。深访常用于动机研究,如消费者购买某种产品的动机等,以发掘受访者非表面化的深层意见。该方法最适用于研究较为隐秘的个人隐私或较敏感的问题,如政治方面的问题。

014

自然界的气候受维度位置、大气环流、海陆分布、洋流和地形等因素的影响,我们称气候和这些因素有着相关关系、


相关关系:现象与现象之间关系的方式及关系的密切程度各不相同。其中一种极端的情况是一个现象(或变量)的变化完全决定另一个现象(或变量)的变化,这种关系就是函数关系。当一个或几个变量取一定的值时,另一个变量有唯一确定的值与之对应,则称这种关系为确定性的函数关系,记为y=f(x),其中x称为自变量,y称为因变量。函数关系是一一确定的关系,即一个变量发生变动,另一个变量会严格按照函数关系发生变动。实际问题中变量之间的关系往往更复杂,变量的变动会受到很多因素的影响,有的因素可能超过了我们目前的认知,有的无法量化,所以真实世界中的变量关系往往不是函数关系。我们把这种相互依存的,又不是严格确定的关系称之为相关关系(correlation)。相关分析(correlation analysis)就是两个变量之间的关系的描述与度量。



相关推荐

  • 燃气热水器红灯一直闪是怎么回事01-10
  • 康佳更新系统桌面后,开机黑屏,是什么原因?01-10
  • 地毯不好清洁?那是你没用对方法01-10
  • 油烟机出现异味怎么办?教你一个小妙招,除脏还有油烟异味01-10
  • 电脑开不了机,风扇转一会儿就停了是什么原因01-10
  • 变频模块保护的原因及其故障诊断01-10