紫郁:统计分析工具的演变历史是怎样的

综合问答 3年前 (2020) https://www.55wd.com

于海忠的回答:

统计学的英文statistics最早源于现代拉丁文statisticum collegium(国会)以及意大利文statista(国民或政治家)。德文Statistik,最早是由Gottfried Achenwall于1749年使用,代表对国家的资料进行分析的学问,也就是“研究国家的科学”。在十九世纪统计学在广泛的数据以及资料中探究其意义,并且由John Sinclair引进到英语世界。 统计学是一门很古老的科学,一般认为其学理研究始于古希腊的亚里斯多德时代,迄今已有两千三百多年的历史。它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情”,“政治算数”和“统计分析科学”三个发展阶段。所谓“数理统计”并非独立于统计学的新学科,确切地说:它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础,但是它不属于统计学的范畴,而属于数学的范畴。[1] 与“城邦政情”阶段没有很明显的分界点,本质的差别也不大。 “政治算术”的特点是统计方法与数学计算和推理方法开始结合。分析社会经济问题的方式更加注重运用定量分析方法。 1690年英国威廉·配弟出版《政治算数》一书作为这个阶段的起始标志。 威廉·配第用数字,重量和尺度将社会经济现象数量化的方法是近代统计学的重要特征。因此,威廉·配第的《政治算术》被后来的学者评价为近代统计学的来源,威廉·配第本人也被评价为近代统计学之父。 配第在书中使用的数字有三类: 第一类是对社会经济现象进行统计调查和经验观察得到的数字.因为受历史条件的限制,书中通过严格的统计调查得到的数据少,根据经验得出的数字多; 第二类是运用某种数学方法推算出来的数字。其推算方法可分为三种: 平均数为基础进行推算的方法”; 第三类是为了进行理论性推理而采用的例示性的数字。配第把这种运用数字和符号进行的推理称之为“代数的算法”。从配第使用数据的方法看,“政治算数”阶段的统计学已经比较明显地体现了“收集和分析数据的科学和艺术”特点,统计实证方法和理论分析方法浑然一体,这种方法即使是现代统计学也依然继承。[2] 在“政治算术”阶段出现的统计与数学的结合趋势逐渐发展形成了“统计分析科学”。 十九世纪末,欧洲大学开设的“国情纪要”或“政治算数”等课程名称逐渐消失,代之而起的是“统计分析科学”课程。当时的“统计分析科学”(Science of statistical analysis)课程的内容仍然是分析研究社会经济问题。 “统计分析科学”课程的出现是现代统计发展阶段的开端. 1908年,“学生”氏(William Sleey Gosset的笔名Student)发表了关于t分布的论文,这是一篇在统计学发展史上划时代的文章。它创立了小样本代替大样本的方法,开创了统计学的新纪元。 现代统计学的代表人物首推比利时统计学家奎特莱(Adolphe Quelet),他将统计分析科学广泛应用于社会科学,自然科学和工程技术科学领域,因为他深信统计学是可以用于研究任何科学的一般研究方法. 现代统计学的理论基础概率论始于研究赌博的机遇问题,大约开始于1477年。数学家为了解释支配机遇的一般法则进行了长期的研究,逐渐形成了概率论理论框架。在概率论进一步发展的基础上,到十九世纪初,数学家们逐渐建立了观察误差理论,正态分布理论和最小平方法则。于是,现代统计方法便有了比较坚实的理论基础。[1] 统计学(statistics):收集、处理、分析、解释数据并从数据中得出结论的科学。 描述统计(descriptive statistics):研究数据收集、处理和描述的统计学方法。 推断统计(inferential statistics):研究如何利用样本数据来推断总体特征的统计学方法。 变量(variable):每次观察会得到不同结果的某种特征。 分类变量(categorical variable):观测结果表现为某种类别的变量。 顺序变量(rank variable):又称有序分类变量,观测结果表现为某种有序类别的变量。 数值型变量(metric variable):又称定量变量,观测结果表现为数字的变量。 均值(mean):均值也就是平均数,有时特指算术平均数,这是相对其他方式计算的均值,求法是先将所有数字加起来,然后除以数字的个数,这是测量集中趋势,或者说平均数的一种方法。 中位数(median):也就是选取中间的数,要找中位数,首先需要从小到大排序,排序后,再看中间的数字是什么。 众数(mode):众数也就是数据集中出现频率最多的数字 为了将统计学应用到科学,工业以及社会问题上,我们由研究母体开始。这可能是一个国家的人民,石头中的水晶,或者是某家特定工厂所生产的商品。一个母体甚至可能由许多次同样的观察程序所组成;由这种资料收集所组成的母体我们称它叫时间序列。 为了实际的理由,我们选择研究母体的子集代替研究母体的每一笔资料,这个子集称做样本。以某种经验设计实验所搜集的样本叫做资料。资料是统计分析的对象,并且被用做两种相关的用途:描述和推论。描述统计学处理有关叙述的问题:资料是否可以被有效的摘要,不论是以数学或是图片表现,以用来代表母体的性质?基础的数学描述包括了平均数和标准差。图像的摘要则包含了许多种的表和图。 推论统计学被用来将资料中的数据模型化,计算它的机率并且做出对于母体的推论。这个推论可能以对/错问题的答案所呈现(假设检定),对于数字特征量的估计(估计),对于未来观察的预测,关联性的预测(相关性),或是将关系模型化(回归)。其他的模型化技术包括变异数分析(ANOVA),时间序列,以及数据挖掘。 相关的观念特别值得被拿出来讨论。对于资料集合的统计分析可能显示两个变量(母体中的两种性质)倾向于一起变动,好像它们是相连的一样。举例来说,对于人收入和死亡年龄的研究期刊可能会发现穷人比起富人平均来说倾向拥有较短的生命。这两个变量被称做相关的。但是实际上,我们不能直接推论这两个变量中有因果关系;参见相关性推论因果关系(逻辑谬误)。 如果样本足以代表母体的,那么由样本所做的推论和结论可以被引申到整个母体之上。最大的问题在于决定样本是否足以代表 整个母体。统计学提供了许多方法来估计和修正样本和收集资料过程中的随机性(误差),如同上面所提到的透过经验所设计的实验。参见实验设计。 要了解随机性或是机率必须具备基本的数学观念。数理统计(通常又叫做统计理论)是应用数学的分支,它使用机率论来分析并且验证统计的理论基础。 任何统计方法是有效的只有当这个系统或是所讨论的母体满足方法论的基本假设。误用统计学可能会导致描述面或是推论面严重的错误,这个错误可能会影响社会政策,医疗实践以及桥梁或是核能发电计划结构的可靠性。 即使统计学被正确的应用,结果对于不是专家的人来说可能会难以陈述。举例来说,统计资料中显著的改变可能是由样本的随机变量所导致,但是这个显著性可能与大众的直觉相悖。人们需要一些统计的技巧(或怀疑)以面对每天日常生活中透过引用统计数据所获得的资讯。 测量的尺度 统计学一共有四种测量的尺度或是四种测量的方式。这四种测量(名目、顺序、等距、等比)在统计过程中具有不等的实用性 。 等比尺度(Ratio measurements)拥有零值及资料间的距离是相等被定义的; 等距尺度(Interval measurements)资料间的距离是相等被定义的但是它的零值并非绝对的无而是自行定义的(如智力或温度的测量); 顺序尺度( Ordinal measurements)的意义并非表现在其值而是在其顺序之上; 名目尺度(Nominal measurements)的测量值则不具量的意义。 以下列出一些有名的统计检定方法以及可供验证实验数据的程序 Fisher最小显著差异法(Fisher's Least Significant Difference test ) 学生t检验(Student's t-test) 曼-惠特尼 U 检定(Mann-Whitney U) 回归分析(regression analysis) 相关性(correlation) 皮尔森积矩相关系数(Pearson product-moment correlation coefficient) 史匹曼等级相关系数(Spearman's rank correlation coefficient ) 卡方分布(chi-square ) 创立时期 德国的斯勒兹曾说过:“统计是动态的历史,历史是静态的统计”。可见统计学的产生与发展是和生产的发展、社会的进步紧密相联的。 统计学的萌芽产生在欧洲,17世纪中叶至18世纪中叶是统计学的创立时期。在这一时期,统计学理论初步形成了一定的学术派别,主要有国势学派和政治算术学派。

去留无意的回答:

经济制度

  货币唐王朝建立后,迅速出台了自己的铸币政策。武德四年(621年)七月,“废五铢钱,行开元通宝钱,径八分,重二铢四絫(lěi),积十文重一两,一千文重六斤四两”。确立了国家铸币的法币地位。同时,又继承魏晋南北朝时期以绢(juàn)帛为货币的传统,实行了“钱帛兼行”的货币制度——钱即铜钱,帛则是丝织物的总称,包括锦、绣、绫、罗、绢、絁(shī)、绮(qǐ)、缣(jiān)、紬(chōu)等,实际上是一种以实物货币和金属货币兼而行之的多元的货币制度。唐政府不断出台严厉打击私铸和滥铸等的法令,并禁断使用恶钱,但是由于铜钱供应量严重短缺,币值不断上升坚挺,私铸和滥铸有暴利可图,所以成效并不理想。两税法实行以后社会发展中长期存在的一大矛盾,突出表现为钱重物轻即所谓“钱荒”问题的不断恶化。唐朝的gdp在当时的世界为348亿美元,占世界gdp比重:58% 。

户口

  650年唐朝统计户380万。705年达到615万户,3714万余口。到了开元盛世740年,户841.2871万,口4814.3609万。安史之乱前一年的754年,户达906.9254万,口达5288.0488万。安史之乱时期760年户193.3174万,其中不课户117.4592万,口1699.0386万,其中不课口1461.9587万。唐朝后期户籍统计和管理混乱废弛,数据较为混乱。

赋税收入

  唐朝中期780年实行两税法,当年税钱1089万八千余缗,谷215万七千余石。821-824年年均税收3515.1228万贯、石(一贯=一缗),唐后期853年税收下降到925万余缗,其中盐利达278万余。随着唐朝对盐商压迫加剧,直接引发了黄巢起义。

农业

  唐朝农业生产工具又有新的进步。曲辕犁就出现在唐朝。还出现了新的灌溉工具水车和筒车。唐朝前期,仅见于记载的重要水利工程就高达一百六十多项。其中著名的如玉梁渠、绛岩湖、镜湖等。天宝年间,唐朝耕地面积达到八百五十万顷。粮食产量也有提高。天宝八年,官仓存粮达九千六百万石。长安洛阳米价最低时每斗仅十三文,青州、齐州每斗仅五文。唐朝后期,由于人口南移加上土地开垦及大修水利,南方的粮食产量大幅增加。

手工业

  唐朝手工业分官营和私营两种。工部是主管官营手工业的最重要部门,直接管理的机构有少府监、将作监、军器监。少府监主管精致手工艺品;将作监主管土木工程的兴建;军器监负责兵器的建造。监下设署、署下设作坊。此外还有铸钱监和冶监等。官营手工业的产品一般不对外销售,只供皇室和衙门消费。工人则分为工匠、刑徒、官奴婢、官户、杂户等。私营手工业较官营手工业比不发达。唐朝前期主要手工业有纺织业、陶瓷业和矿冶业。唐后期,南方手工业大幅进步,特别是丝织业、造船业、造纸业和制茶业。

 

 

军事体制

  在军事上,军力强大是唐代的一个鲜明的特点。唐朝统一了隋朝末年军阀割据的中国。唐太宗、高宗、武后在位时又远征东西两突厥,灭高昌、收其地为州县,灭高句丽和百济并在白村江战役打败日本援军,又与靺鞨、铁勒、室韦、契丹等民族征战。当时唐朝在亚洲军事制度,经济和科技的优势都是这些战绩的基础。唐玄宗时唐朝的势力与来自现在阿拉伯、新兴和信奉伊斯兰教逊尼派的阿拔斯王朝(即黑衣大食)的势力在包含昭武九姓国、大小勃律、吐火罗在内的中亚诸国相遇,结果唐朝在怛罗斯战役惨败,中国的势力从此退出中亚。接踵而至的安史之乱和藩镇割据导致华北地区经济萧条和胡化。

  唐朝的众多著名将领中,除了神将薛仁贵、凌烟阁二十四功臣中的将领、郭子仪、李晟及其子李愬、高骈等汉族统帅外﹐异族将领也占据了重要地位:比较重要的有胡人安禄山、史思明、百济人黑齿常之、高句丽人高仙芝、契丹人李光弼、靺鞨人李怀光、突厥突骑施部人哥舒翰、铁勒部的仆固怀恩、浑瑊和阿跌光进等。

  均田制和租庸调制的破坏导致府兵制改为征兵制和募兵制。安史之乱中,临时代府兵制而起的扩骑并不能抵御与节度使的兵力。自始唐朝在军事上失势:内有藩镇割据,外有回纥、吐蕃、南诏的入侵。例如唐朝需要借回纥兵来平定安史之乱,763年吐蕃军曾经占领长安达十五日,南诏军一度攻打成都并占领安南直至十国的南汉才收回。唐朝防备南昭之士兵不满又导致了庞勋之变。后来的黄巢的流寇叛乱导致朱全忠和沙陀人李克用的争战,直至唐朝灭亡后依然未平息。

版权声明: 发表于 2020-10-28 10:55:05。

本文由第三方用户分享仅代表作者观点,不代表本网站立场,秉承互联网开放分享的精神,目的在于传递更多信息,加强各行业互通交流,但对内容不作任何保证或承诺,请读者自行参考斟酌。网站发布的信息(包含但不限于版式、图片、字体、文章等素材)由第三方用户分享,版权归原作者所有,本站不承担任何相关的版权纠纷等相关责任。如您认为本篇内容侵犯了您的权益,请与我们联系,我们会及时处理。

豌豆资源网专注分享全网综合资源网站大全,致力于超实用的内容资源搜索。

转载请注明:
本文标题:紫郁:统计分析工具的演变历史是怎样的
本文地址:https://55wd.com/s153240/