登陆注册
1908500000038

第38章 贝叶斯定理:只有正确的预测才能让我们更接近真相(8)

很多领域的情况介于这两种极端情况之间。数据通常还不错,但是仍不够好,对产生这些数据的系统和过程,我们都有所了解,但了解得还不够充分。在此类案例中,要想改进预测,也许能够借用“深蓝”的程序员们处理数据的方法:试错法。这也是许多公司经营战略的核心所在,这些公司和当今这个大数据时代可谓休戚相关。

用试错法提高计算机的预测能力

2009年年末,我到加利福尼亚州芒廷维尤的谷歌总部进行采访,在那里,你很难分清谷歌的员工什么时候是在严肃工作,什么时候是在嬉笑玩闹。谷歌公司以“红、黄、蓝”三原色为装饰主色调,配备排球场,还有可想象到的各种造型的两轮摩托车,这样的公司文化能激发员工的创造力。每一个谷歌人,甚至包括工程师或经济学家,都可以不落俗套、异想天开。

“这类实验这里随时都有,”谷歌首席经济学家哈尔·瓦里安在和我会面时这么说道,“你更应该把这里看作一个有机体,一个有生命的组织。我曾经说过,某个物体被赋予生命后就应该得到我们的关注,就像《终结者》中的天网一样。但是,我们已经和加利福尼亚州政府达成协议。”那时,阿诺·施瓦辛格正担任州长。“他们会来帮助我们。”

谷歌对其研究项目和其他产品进行了广泛测试。瓦里安说:“2008年,我们对研究项目进行了6 000次实验,广告货币化的实验大约也有6 000次。所以,谷歌一年大约要进行10 000次实验。”

其中有些实验是有形的——偶尔还能延伸出一条新的产品链。但大多数实验都较难被觉察:将公司的标志移动几个像素的位置,或是对广告牌上背景颜色的序列稍作改变,然后观察调整后的点击量的变化或是货币化的效果。其中许多实验会应用到约0.5%的谷歌用户中,是否应用取决于这个构想的发展前景。

当你利用谷歌搜索词条时,你可能没有意识到自己已经参与到谷歌的实验中。但从谷歌的角度看,事情则稍有不同。谷歌返回给你的搜索结果和首页中显示的排序,代表了谷歌对你认为最有用的搜索结果所作的预测。

对有用性的衡量和预测貌似非常主观,那谷歌又是如何做到的呢?如果你搜索“最好的新墨西哥餐厅”这一词条,这是否说明你正计划到阿尔伯克基旅行呢?还是说明你在寻找最近刚开业的墨西哥餐馆?又或许你想要知道哪家墨西哥餐馆有怒希沃拉丁菜?也许你应该组织好搜索的问题,可你并没有这样做。于是谷歌会召集1 000个陪选团,他们都提出了相同的问题,谷歌会呈现给他们丰富多变的网页,让他们从零到10为每一个网页的有用性评级。然后,谷歌展示给你的网页就是按级别高地排列的结果。

当然,谷歌不可能对每个搜索问题都进行这样的操作,因为每天公司会收到上亿条搜索。但是,瓦里安告诉我,当出现有代表性的搜索问题时,他们仍会使用人工评测。然后他们会对比哪个统计测量的结果(尤其是从相关性和有效性上来看)和人工判断的结果相关。谷歌针对网站的统计测量最著名的就是PageRank信号了,这个测量案例根据网站的外部链接和内部链接的数量来衡量网站的价值。但是,PageRank信号不过是谷歌200个信号中的一个,谷歌利用这些信号一步步向人工评估结果靠拢。

当然,这个任务并不轻松——要将200个信号应用到几乎存在无限可能的搜索问题中。这就解释了为什么谷歌如此强调实验和测试。你所知道的谷歌搜索这一产品质量已经很高了,但明天公司可能又会对其进行调整。

谷歌公司之所以成功,是因为它将严密谨慎的测试和随心发挥的创新文化有机地结合起来。公司鼓励员工超越电脑,去做电脑做不了的事情:要想点子,各种各样的好点子。随后,谷歌会使用大量的数据测试这些点子。其中大多数点子很快会遭到淘汰,但最棒的点子会保留下来。

计算机程序就是用这种筛选的方式下象棋,它能够探寻几乎所有可能的选择,并进行一定程度的研究,但它更加关注那些更有攻击潜力的招数。这一点十分符合贝叶斯定理:谷歌永远都处于运行的开端,不断修正其搜索运算程序,永远不会因为觉得这些程序已经完成而停止。

谷歌基本上能够立刻获得全球百万名用户的反馈,但多数时候,我们无法像谷歌这样迅速获得反馈来检测一个构想。“深蓝”的工程师们可以方便使用超级计算机,但是我们却没有这个条件,所以进步速度就要慢得多。

然而,我们要关注自己的预测在现实生活中的表现,而不是只满足于它在数据模型中的表现,简言之,就是立下自我检查的承诺,这也许是加快我们学习预测过程的最佳途径。

克服人类的技术盲点

在许多方面,我们自身已成为最大的技术障碍。人类缓慢稳固的进化进程已经远远落后于科技进步的步伐:人类进化以千年来算,然而技术的处理能力每隔一年几乎就翻一番。

我们那些生活在山洞中的祖先可能已经发现了一个问题,即拥有强大甚至过盛的模式识别技能是极为有利的,这样就能够在一瞬间识别出远处树叶的瑟瑟声是风引起的还是一头入侵的灰熊制造的。如今,在这样一个快节奏的社会里,各种数字和统计数据泛滥成灾,原本的习惯和倾向反而让我们陷入麻烦:当我们看到一系列的随机数字时,竟能看出其中根本就不存在的模式。(广告人和政客们常常利用这种现代骗术来欺骗我们。)

国际象棋则能引导我们走向美好结局。卡斯帕罗夫和“深蓝”的程序员将彼此视为敌手,但是他们都教会我们一点——预测时,计算机的处理速度和人类思维的精巧应该相互补充。

事实上,目前世界上最精彩的象棋比赛既不是由某位人类棋手完成的,也不是某台机器完成的。2005年,ChessBase.com网站举办了一场“自由式”国际象棋锦标赛:选手可以随意地使用自己喜欢的计算机程序补充自己的见解,并通过互联网征求建议。尽管一些大师也参与了比赛,但是比赛的赢家既不是最厉害的人类棋手,也不是那些使用最先进电脑软件的选手,而是由来自新罕布什尔州的两名二十几岁的象棋业余爱好者——史蒂文·克兰普顿和扎克里·“柴克斯”·史蒂芬——共同获得,他们将3套计算机程序结合起来算出结果,共同决定棋路。克兰普顿和史蒂芬之所以获胜,是因为他们既不敬畏技术,也没有被它吓倒。他们了解每个程序的优缺点,他们更像一个教练,而不是选手。

然而,看到 “电脑认为洋基队将赢得世界大赛”这样的句子时,你应该保持警惕。但如果它是以下这句话的速记版本——“计算机程序输出的结果是洋基队将赢得世界大赛”——那它可能不会带来什么恶性后果。当今世界信息横流,能够拥有那些计算速度远超过我们的机器,肯定是大有裨益的。

但是,如果你感觉预测者更倾向于这种看法——认为计算机是一个有知觉的个体,或是一个有自己思想的模型——这也许就表明这位预测者根本就没有进行什么思考。无论预测人员带有什么偏见和盲点,这些偏见和盲点肯定会被复制到他的计算机程序中。

我们必须以客观的态度看待科技——它就是一个能改善人类生存环境的工具。我们既不应该对技术的祭坛顶礼膜拜,也不该被它吓唬住。至今还没有人设计出一台能与人类相媲美的计算机,或许永远也没有人能做到这一点。但计算机本身就是人类进步和智慧的反应:如果某个技巧是由人设计的,那它就算不得真正的“人工”智能。

同类推荐
  • WTO知识简明读本

    WTO知识简明读本

    本书描述了20世界即将结束时终于克服了最主要的障碍。中国对外开放事业进入了新的历史阶段。
  • 宏观经济内外均衡与我国外贸发展战略调整分析

    宏观经济内外均衡与我国外贸发展战略调整分析

    本书的创新之处主要体现在逻辑思想和研究视角上,也就是说,本文将国际经济学的内外均衡理论、国际贸易理论和发展经济学的外贸发展战略理论有机结合起来,并将外贸发展战略视为实现内外均衡目标政策协调的内生变量,然后从内外均衡目标与外贸发展战略的关系上来研究我国外贸发展战略问题,并最终提出“开放型内外均衡导向的外贸发展战略”模式应是我国在新的国内、国际环境下的最佳选择。
  • 中国经济盛世背后

    中国经济盛世背后

    在主旋律的宣传下,我们听惯了几十年来中国高速发展的种种成果,听惯了“大国崛起”,听惯了“民族复兴”。然而,在这一切华丽表象的背后,我们到底处在一个什么样的位置?我们真的活在盛世吗?盛世又是什么样的?盛世真的那么幸福吗?从人们的日常经济生活人手,分析了当今中国经济盛世背后的诸多问题,指明了我们与世界存在的巨大差距,告诉了人们盛世背后的冰冷真相。盛世与否并不重要,改善民生,让每个人过得更好才是政府最应该关注的问题。
  • 给大忙人看的经济学

    给大忙人看的经济学

    你是否觉得,经济学是学校里那些戴眼镜的教授和学生才能弄懂的学问?觉得经济学太难懂了?觉得“不知道这些,生活照样不成问题”呢?大错特错!事实上,我们的日常生活处处都有经济学的身影。小到菜市场的菜价涨跌,大到国家进出口贸易的变化,无不与经济学息息相关。无论你是学生、公务员、店面老板,还是打着领带的上班族,都可以从生活点滴中,发现不错的经济话题。
  • 在参与中成长的中国公民社会:基于浙江温州商会的研究

    在参与中成长的中国公民社会:基于浙江温州商会的研究

    本书的目的和意义在于:首先,通过对浙江公共财政改革的独特现象的剖析,从理论与实践、历史与现实两个层面的相互联系中梳理、归纳和勾勒浙江公共财政建设的历史进程以及阶段性特征,描述出浙江公共财政制度改革在曲折中前进的大趋势,概括和总结出公共财政建设中的大量浙江特色和浙江经验,并揭示和剖析存在并须进一步改革和完善的各种现实性公共财政难题,为浙江进一步的财政改革提供现实的政策参考和决策依据。
热门推荐
  • 群仙列传

    群仙列传

    笑倾城,天下醉,千古红颜叹自愧,把酒问月苍天褪,祸水未必沾红绯。她,帝俊之孙,女娲伏曦之后,可她甘愿永世不动‘情’一字,只愿她的父母平安。她,手握十二式神,可呼风唤雨,违天改命,现任天帝义和都让她三分,可她却永恒不记得自己是谁。她最常说的一句话:“唉!我又忘了!”‘她’风华绝代,‘她’倾城倾国,‘她’是涡水,却未必是红颜。‘她’就是天下第一美人。可那又如何?因为那个她许下永世不情的誓言,所以她根本不会爱上任何人?也包括‘她’。纵便‘她’风华绝代倾城倾国,那有何用?
  • 帝天霸道

    帝天霸道

    黑暗纪元,天崩地裂,天地洪荒,唯我独尊,十方宇宙,群魔乱舞。不朽的传奇在这里上演,当黑暗吞噬光明之后,天地间留给我们的还有什么。
  • 佛说甚希有经

    佛说甚希有经

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。
  • 不太严肃的异世界食堂日常

    不太严肃的异世界食堂日常

    这是一个在异世界开餐厅的轻松日常物语,这是一个平凡人逐渐变得不再平凡的故事,这是一个并不严肃的,异世界食堂日常。
  • 火影之青鸟

    火影之青鸟

    只有一种,是所有人都能平等的命运——那便是“死”。
  • 个人观影指南

    个人观影指南

    因为我喜欢看电影,想要分享一些好电影而已。装比打脸什么不是追求,业余写手,更新随缘,狂带私货,随时会被404,废话超多,剧情展开奇慢无比,日常咸鱼发作,想放弃,随时完结!标签都是乱选的
  • 仙门遍地是奇葩

    仙门遍地是奇葩

    原来仙门竟是这般不以为耻,当真是脸皮厚到极致。师傅喜欢徒弟,徒弟却为魔界鬼祭哭得死去活来。好一个郎艳独绝,遗世独立的灵澈仙人。又好一个不知羞耻,仙门之辱的徒弟。不愧是仙门之境,遍地奇葩,魔为仙成仙,仙为魔堕魔;不疯不魔,不魔不仙(ps:纯属瞎七八扯,毫无逻辑。)
  • 狂妃毒步天下

    狂妃毒步天下

    "二十一世纪独霸医术一道的陌晴悠魂穿异界,还未适应古代生活,就被太子一旨退婚书给甩了。叔可忍婶不能忍!晕迷受到陷害,被人指指点点的就算了,她还没找这对狗男女算帐呢!他们倒先把屎盆子扣到她身上。太子了不起?白莲花会装逼?且看她如何一步步把他们的面孔揭露人前,让他们明白,花儿为何这么样的红!"
  • 贪恋红尘三千尺

    贪恋红尘三千尺

    本是青灯不归客,却因浊酒恋红尘。人有生老三千疾,唯有相思不可医。佛曰:缘来缘去,皆是天意;缘深缘浅,皆是宿命。她本是出家女,一心只想着远离凡尘逍遥自在。不曾想有朝一日唯一的一次下山随手救下一人竟是改变自己的一生。而她与他的相识,不过是为了印证,相识只是孽缘一场。
  • 天剩

    天剩

    当遮蔽天空的大道死去,剩余的时代还有什么? 新的年轮已经启动,旧的序幕还不曾落下。 一个个人走出,一个个人相遇。各自的主角勾勒,命运的轨迹交错,历史的画卷涂抹,恢宏的序幕揭开……他们的他们,最终又将走向何方? (简介尽力,写作随心,好坏由他)