admin管理员组

文章数量:821343

80老翁谈人生(291):揭开沃森超级电脑的神秘面纱

80老翁谈人生(291):揭开沃森超级电脑的神秘面纱

    当今,国外媒体掀起鼓吹IBM沃森超级电脑的狂浪,每天新闻不断。沃森超级电脑是什么“神物”?它的工作原理如何?

                       2016年6月,美国知名人工智能专家JamesHendler教授(1957- )应邀在国际人工智能大会(IJCAI 2016)上深入浅出地讲解了沃森超级电脑的工作原理,值得一读。

    他说:我们把沃森超级电脑设想为一间环形办公室走廊,每一间办公室都有一群人做着特殊的工作,让我们从头来梳理整个运行过程。

  • 问题输入(QUESTION IN)
  • 问题分析 (Question Analysis)

这个问题什么意思?

我们在找什么?

还存在其他有效信息么?

问题中有没有词语提到问题中的其他词语?

在这一环节,IBM的DeepQA软件自动尝试去理解这个问题,搞清楚问题到底在问什么,同时做一些初步的分析来确定选择哪种方法来应对这个问题。

  • 初步搜索 (Primary Search)

在数据库中能不能找到或许跟这个问题有关的文件?

找到了多少文件?

这些文件从哪里来的?

  • 搜索结果处理并生成备选答案 (Search Result Processing and Candidate Answer Generation)

在这些文件中,有这个问题可能的答案么?

有多少个备选答案?

     当问一个问题时,一份文档就打开了。文档在办公室中不断移动时,更多信息被添加进去了。

  •  上下文无关回答得分 (Context-Independent Answer Scoring)

这个选择有可能是正确的答案吗?

这个选择是正确的答案形式吗?

  • 软滤波( Soft Filtering)

有哪些选择是明显错误的?

如果是的话,能不能让它们在后面的处理过程中不占太多的时间?

   每个可能的回答都被给定一个分数,给出这个证据对备选答案支持得到底有多好。

  •  支持证据检索( Supporting Evidence Retrieval)

能在数据库中找到任何能够证明某个选择答案是正确的信息吗?

对每个选择来说有多少信息在哪?

  • 搜索结果处理和上下文相关得分 (Search Result Processing and Context Dependent Scoring)

选择工作作为问题回答怎么样?

现在有更多的信息,能给每个选择什么分数?

  • 最终合并并排名(Final Merging and Ranking)

每个选择的总分是多少?

哪个选择分数最高?

分数第二高的选择是什么?    

还有任何能够改变分数的额外信息吗?

DeepQA也观察到了这种现象:不同的表面形式通常会被不同的证据支持,并得到完全不同但潜在互补的分数,这产生了一种方法:将答案分数在排名和信心计算之前先合并掉。

  •  输出答案 (ANSWER OUT)

有用的最高分答案被返回,然后沃森尝试判断从它做的多好(或者多坏)中进行学习。

由此可见,Waltson的工作原理就是“实事求是”,不是耍嘴皮子。

袁以

本文标签: 80老翁谈人生(291)揭开沃森超级电脑的神秘面纱