《数据统治世界》读后感2000字

这是美国纽约大学统计学教授冯启思有感于日常生活中,人们面对数据的混乱无所适从,从统计学中的五种现象提出统计式应用思维,以供读者参考。

1831年比利时统计学家阿道夫*凯特勒将统计式思维引入社会学。在此之前,统计学和概率性局限在天文学家和数学家的小圈子里。天文学家用来解析天文现象,数学家用来分析赌博游戏。

作者以迪士尼排队问题、明尼苏达州支持匝道控制为案例,认为读者需要的是关注异常值,而非平均数本身。上下班时刻,人们在匝道控制仪前面的等待有个忍耐的极限。政府做决定时需要把公众的感觉考虑进去,而不能仅仅依靠工程和规划原理。

20世纪50年代布拉德福德*希尔爵士发明的病例对照研究(符合:强关联性;人、地、时之间的一致性;一个原因、一个结果;原因先于结果;生物学上的可信性;跟过去的知识一致。不符合:高剂量,强反应;实验证据;相似)‘病例对照研究’的发明、稀缺信息的网络汇集和统计学、实验室检验、田野调查的综合对流行病调查的成功起了巨大的作用。

一代代的流行病专家承认不经过艰巨的和一丝不苟的努力,任何对因果关系的断言都是脆弱无力的。流行病学统计学家的6大挑战:数据极少(所做出的判断取决于10个以下的病例);时间紧迫(人们正在死去);信息不完全(一些人会说‘想不起来’);信息不可靠(人们可能会想象一些东西);需要找到起因(这个工作打开了很多条通向错误的道路);出错的后果(这个是不言自明的)。

《数据统治世界》.jpg

20世纪60年代发明的信用评分系统,如今被用来评估客户关系经过风险调整后的盈利能力,用来设定借款人可得到的最初和持续积累的信用额度,用来协助完成贷款业务中的一系列活动,包括欺诈侦测、逾期债务干预和减轻损失等。

当然也系统会出错,比如信息不准确、内容不完整。常见的错误包括打错字、张冠李戴、身份欺诈、重复登记、记录过时、信息丢失等。据称在信誉评分系统后面隐藏着歧视性待遇。

作者认为,更好地掌握产品召回的代价和益处比研究信用评分中的因果关系更能引起消费者的兴趣。白人与黑人的成绩差距,需要用到的是同类(同层次能力)比较,而不是种族性看待。

统计学家认为‘百年一遇的飓风’这个概念与概率有关,而非频率;衡量的标准是经济学的损失,而不是历法。‘百年一遇的飓风’指的是所造成的经济损失比历史上99%的飓风都要严重的那种飓风。在任意一年中,这种飓风登陆的机会是1%。

在职业比赛检测中,有不少方法可以制造假阴性:趁检验员不注意,往样本里渗点威士忌,然后摇一摇;故意给检测员指错方向,然后上演一出交通事故的大戏以避开赛外检查;在身体内存储朋友的尿;要相信人类的弱点,如果某个无能的实验室检测员把其中的一份样本给冷冻了,就不能做实验;要保持领先;只使用最新设计的药物;很容易就能从前门通过。

申请可以用药的通行证;有哮喘症,可以光明正大地服用。无论类固醇检测是通过测量红细胞比容还是别的指标,所有的检测原理都是相同的。

通过设置一个分离线,反兴奋剂专家依据对每种类型的错误的容忍度来明确地校准检测结果。因为假阳性会招致恶劣的宣传,因此要优先控制这些错误。然而,这个原则必然意味着有些药物诈欺会被放过,特别是因为检测员能隐藏在那些不可见的假阴性的背后。

实际上,两种类型的错误(假阳性与假阴性)所带来的代价是非对称的;在校准检测系统时,决策者有意或无意地向那些具有公共性、影响比较大的错误倾斜。对兴奋剂检测来说,那就是假阳性错误;对测谎仪来说,就是假阴性错误。但是,由于消长关系肯定会发生这样的情况:努力降低此错误发生的概率必然会加重其他错误发生的概率;因为另一种错误很少被人看到,它的破坏力通常不会引起注意。

大部分人倾向于只注意异常的类型,而统计学家则喜欢在整个背景下评价数据。

公众通常更加关心以下五种类型的灾难。悲剧叙事:收罗手头的资料对灾难事实进行详尽报道;人情味新闻:挑一个不幸的受害者,讲他的故事;感觉良好的故事:不同组织齐心合力对付灾难;侦查报告:引用工程师、保险商、路人、心理学家甚至通灵者的话对这次事件进行多角度分析;综合报道:承蒙编辑们的辛苦劳动。而从统计学的世界观来看,小概率事件意味着不可能。

作者总结本书五种现象以及应该具有的统计式思维,对平均化的不满,总要询问一下变异性;出错的好处,从事实中发现有用的信息;混同的困境,同类进行比较;非对称性的摇摆,留意两种错误类型之间的让步;小概率的力量,作文www.yuananren.com不要以为稀有事件会发生。

统计学的难题在于变异,而统计模型是用来考察变化原因的工具。疾病暴发模型把原因和结果联系起来说明为何有些人会发病而另一些人则全然无事;信用评分模型识别相关特征用来描述哪些借款人最可能拖欠贷款而哪些人不会。比较温和的变异类型形成了汽车保险业的基础,而极端的类型威胁到飓风保险商。

所有的模型都是错的,但有些是有用的。激励机制从来都不是静止的,随着商业循环的变化而变化。

统计检验即可以证明未发生事件的不可能性,也可以用来证明已发生事件的不可能性。统计检验准则要求不相信奇迹。

由于统计学家们所接受的训练使他们相信极端事件是不可能发生的,因此不惧飞行,也不玩彩票。实际上,如果一个实验在反常的条件下的确发生了,这对研究没有什么用,因此必须安排新的实验。

《《数据统治世界》读后感2000字》.doc
将本文下载保存,方便收藏和打印
导出文档
复制全文
导出文档

1:《霍乱时期的爱情》读后感300字

2:《女人和蛇》读后感1000字