人人有本用

首页 » 虫窝销售专区 » ThinkPad 行情交流 » IBM百年小故事:电脑沃森
大虫 - 2011/6/16 9:14:00
IBM百年小故事:电脑沃森
  2011年 2月,IBM 电脑沃森将在 Jeopardy! 电视问答秀中对抗两位最大的全能冠军选手,让我们共同见证这一历史时刻。电脑沃森运行 IBM 研究中心开发的 Deep QA 软件。尽管这个项目的重大挑战是在 Jeopardy! 中获胜,但沃森的更大目标是创造新一代技术,以比标准搜索技术更有效的方式从非结构化数据中找出答案。
  沃森在理解复杂问题并找出最佳答案方面表现优秀。IBM 的科学家们认为,沃森实际上并没有思考能力。15年来在 IBM 研究中心研究自然语言问题并从非结构化信息中寻找答案的 David Ferrucci 说:“我们的目标并非建立一个人脑模型,而是设计出一台能够更有效地理解自然语言并做出互动的电脑,而不一定与真人的行为方式相同。”
  电脑从不善于寻找答案。搜索引擎不会回答问题–它们只是提供数千个与关键字匹配的搜索结果。长期以来,大学研究人员和企业工程师致力于开发问答软件,但最好的结果也只是理解并回答简单、直接的问题(伊丽莎白泰勒共获得多少次奥斯卡奖?),而且错误几率一般会达到近三分之一。这并没有太大用处,远远不能击败 Jeopardy! 冠军。
  这个电视节目中的问题充满了微妙区别、双关语和脑筋急转弯— 这些方面能让真人感到兴奋,但电脑却对此无能为力。对于 Jeopardy! 节目提示“成就亚瑟米勒伟大戏剧的14世纪中有颜色的瘟疫”的正确回答是“什么是推销员的黑色死亡?”得出这个答案的唯一方式是将多个来源的信息综合在一起,因为确切的答案并不可能随处可见。
  沃森运行于一组 Power 750™ 计算机上—十个机架容纳 90台服务器,共有 2880个处理器内核运行 DeepQA 软件和存储器。它的容量相当于大约一百万册书籍的信息。在多年内,沃森吸收了大量信息,包括商业信息文本,例如《世界百科全书》,而且包括允许随意复制的内容,例如维基百科和“古登堡计划”(Project Gutenberg) 的书籍。
  在对沃森提出问题后,100多种算法会以不同方式分析问题,并寻找多个似乎准确的不同答案–所有这些都同时进行。而另一组算法对答案进行排序和打分。对于每个可能的答案,沃森将寻找可能支持或者反驳这个答案的证据。对于数百个可能的答案中的没一个,沃森都寻找一些证据,然后利用火速百种算法对证据支持答案的程度进行评分。具有最佳证据评估结果的答案将获得最高的可信度。评分最高的答案会成为最终答案。然而,在 Jeopardy! 节目中,如果评分最高的可能答案不足以为沃森提供足够的可信度,沃森会决定不按抢答器,并避免在打错时损失奖金的风险。电脑沃森在大约三秒内完成所有这些工作。
  到 2010年末,在位于纽约约克城高地的 IBM 研究中心举行的节目演练中,沃森在找出正确答案方面表现优秀,在与 Jeopardy! 往届冠军的竞赛中,沃森获胜的几率大约是 70%。在 2011年初,沃森战胜了 Jeopardy! 超级明星 Ken Jennings 和 Brad Rutter。沃森采用的问答技术预计将实现商用。IBM 研究中心负责人 John Kelly 对《纽约时报》表示:“我希望创造出能够进入其它零售行业的产品,比如运输业。在时间至关重要而且需要向一线决策人提供先进信息的任何领域,电脑需要超越仅仅作为后端办公室计算机器的角色,而为决策人提供更好的智能化能力。”
1
查看完整版本: IBM百年小故事:电脑沃森