<kbd id='scyqi66y'></kbd><address id='scyqi66y'><style id='scyqi66y'></style></address><button id='scyqi66y'></button>

              <kbd id='a2u4ud80'></kbd><address id='a2u4ud80'><style id='a2u4ud80'></style></address><button id='a2u4ud80'></button>

                      <kbd id='rj75uiy3'></kbd><address id='rj75uiy3'><style id='rj75uiy3'></style></address><button id='rj75uiy3'></button>

                              <kbd id='t0hoiy0o'></kbd><address id='t0hoiy0o'><style id='t0hoiy0o'></style></address><button id='t0hoiy0o'></button>

                                  威尼斯官网

                                  人机威尼斯官网前世今生

                                  日期: 2018-12-17 09:24:37 / 人气: 282

                                  首先aaa,过去的生活

                                  传统的问答系统是人工智能领域的应用程序(AI:人工智能)aaaa,通常仅限于非常狭窄和专业的领域aaaaa,基本上由手动编译的知识库和自然语言界面组成aaaaa。 由于该领域的范围狭窄aaaa,词汇总量非常有限aaaaa,语言和语用的模糊性得到有效控制aaa。 问题是可预测的aaa,甚至是封闭的集合aaa,并且相应的答案自然是统治的aaa。 这个着名的项目有20世纪60年代开发的LUNAR系统aaaaa,致力于回答阿波罗回归的月球岩石样本的地质分析aaaaa。 SHRDLE是另一种基于人工智能的专家系统aaaaa。它模拟了玩具积木世界中机器人的操作aaa。机器人可以回答玩具世界的几何状态aaaa,并听取合法操作的语言命令aaaaa。

                                  TR

                                  这些早期的人工智能探索看起来非常复杂aaaaa,揭示了一个童话世界aaaaa,如科幻小说aaaaa,激发想象力和好奇心aaaa,但实质上这些仅限于实验室的玩具系统aaaaa,完全未被利用aaaa。可能和工业价值aaaaa。 随着人工智能作为一个领域变得越来越窄(一些专家系统已经变得实用aaaaa,基于常识和知识推理的系统正在挣扎)aaa,寄生主义的问答系统基本上已经死了aaaa。 然而aaa,有一些机器到人的对话交互系统(chatterbots)已经发展到目前为止并成为儿童的在线玩具aaa。 (我的女儿喜欢上网寻找机器人对话aaaaa,有时故意问一些奇怪的问题aaaa,程序会回应道路aaaa。当时aaa,我想赞美它aaaa,但更多时候是看着机器人丑陋和大笑aaa。 但是aaaaa,我个人认为这条道路有很大的潜力可挖掘aaa。结合语言学和心理学知识aaa,我们应该能够培养出高质量的机器人心理治疗师aaaa。 事实上aaaa,在今天的高节奏和高竞争时代aaaa,许多人需要摆脱压力aaaaa。很多时候他们只需要一个忠诚的倾听者aaaa。这样的系统可以帮助满足这种社会需求aaaaa。重要的是消除用户对弹钢琴的牛的先入为主的偏见aaaaa,或者试图隐藏机器人的身份aaaa,以便可以打开对话aaa。 拉开aaa,停下来aaaaa。 )

                                  TR

                                  第二aaa,重生

                                  工业意义上的开放式问答系统是另一种方式aaaaa。它随着互联网的发展和搜索引擎的普及而产生aaaa。 准确地说aaaaa,开放式问答系统诞生于1999年aaa,当时寻找行业第八届年会(TREC-8:Text REtrieval Conference)决定增加一个问答系统竞赛aaaa,美国国防部着名的DARPA项目资金由国家标准局组织aaa,这个新兴的问答系统及其社区诞生了aaaa。 Q&A系统竞赛的广告词非常令人兴奋aaa,只是指出了搜索引擎的缺点aaaa,并在搜索领域建立了威尼斯官网价值取向aaaa。 记得写这个(一般):用户有问题aaaaa,他们需要答案aaaaa。 搜索引擎声称他们正在进行信息检索aaa。实际上aaaa,搜索不是所请求的信息aaa,而是仅搜索数千个相关文件的链接(URL)aaaa,并且答案可能在文件中aaaa,也可能不在文件中aaaaa。 无论如何aaaa,人们总是需要阅读这些文件才能找到答案aaa。 问答系统是解决此信息搜索的关键aaa。 对于问答系统aaaa,输入是问题aaa,输出是答案aaaa,就这么简单aaaaa。

                                  TR

                                  话虽如此aaa,当开放式问答系统诞生时aaaaa,有必要介绍学术界和行业的背景aaaaa。

                                  TR

                                  从学术角度来看aaaa,传统意义上的人工智能已经不再流行aaaa,它被基于大规模真实语料库的机器学习和统计研究所取代aaaaa。 语言规则系统仍然在自然语言领域发挥作用aaaa,作为机器学习的补充aaaaa,纯粹基于知识和推理的所谓智能规则系统基本上被学术界所抛弃(除少数的附件外)学者aaaaa,如Douglas Lenat的Cyc)aaaa。在开放式问答系统诞生之前aaa,学术界的一个非常重要的发展是信息提取及其社区的发展aaa。 面对传统的自然语言理解语言(NaturalLanguage Understanding)aaaa,试图分析每个语句以发现其语义差异aaa,信息提取是任务指导aaaaa,任务外的语义不被提取和必要:每个任务都是定义为所请求信息的预设形式aaaaa,例如aaaa,事件的形式需要填写会议的主题aaaa,时间aaa,地点aaa,参与者和其他信息aaaa,类似于填空问题用于测试学生的阅读理解能力aaaa。 这种任务导向思维缩短了语言技术与实用性之间的距离aaa,使研究人员可以集中精力根据任务导向优化系统aaaaa,而不是试图吞噬语言大象aaa。 到1999年aaa,信息提取竞赛及其研讨会已经举行了七届(MUC-7:消息理解会议)aaaa,它也是美国DARPA项目的资助产品(如果DARPA领导美国信息产业研究及其实用性)趋势)aaa,没有太好的声誉)aaa,这个领域的任务aaa,方法和局限性都比较明确aaaaa。 开发的最成熟的信息提取技术是所谓的实体:网元标记aaaaa,包括名称aaa,地名aaaa,组织名称aaaaa,时间aaaa,百分比等aaaaa。 在优秀的系统中aaaa,无论是使用机器学习方法还是制定语言规则的方法aaaa,精度检查率的准确性综合指标已达到约90%aaa,这与人工标签的质量接近aaaa。 这一年轻技术领域的进步在新一代威尼斯官网启动和成功中发挥了关键作用aaa。

                                  TR

                                  到1999年aaa,从工业的角度来看aaa,随着互联网的普及aaaaa,搜索引擎迅速发展aaa。基于关键词匹配和页面链接的搜索算法基本上是成熟的aaaaa,除非有方法论革命aaa,否则应该探索关键词搜索领域aaa。游戏的每个方面几乎都结束了aaaaa。由于搜索技术在信息爆炸时代的期待是无穷无尽的aaaa,搜索行业越来越多地呼吁关键词之外的新技术aaaaa。 用户越来越不满意粗略的搜索结果aaaaa。社交要求需要更精细的结果aaaa。至少应该用文章(URL)替换该片段aaa。最好直接给出答案aaa。不要拖水aaaa。 虽然答案直接需要等待威尼斯官网研究结果aaaa,但从全文搜索细化到段落搜索的工作已在业界实施aaaaa。传统的搜索结果正在从简单的网络链接演变为重点aaa。段aaaaa。

                                  TR

                                  新的威尼斯官网研究已经走上了历史舞台aaaaa,在这种情况下aaaa,业界热切呼唤aaaa,学术界已经奠定了一定的基础aaaaa。 美国标准局测试要求系统为每个问题提供最佳答案aaaa,简短答案(不超过50个字节)和长答案(不超过250个字节)aaa。 以下是第一个测验的示例:

                                  TR

                                  谁是第一个太空美国人aaa?

                                  泰姬陵在哪里aaaa?

                                  Joe DiMaggio在哪一年编制了56场比赛的连胜纪录aaa?

                                  第三aaaa,昙花

                                  这个问答系统竞赛的结果和意义是什么aaaa?应该说结果是好的和重要的aaa。 最好的系统达到了60%以上的准确率aaaaa,这意味着每三个问题aaaa,系统就可以从语言文档中的针上搜索两个正确的答案aaa。 作为学术界开放系统的第一次尝试aaa,这是一个非常令人鼓舞的结果aaa。 这是dot com的鼎盛时期aaa,IT行业渴望将这项最新研究从学术界转移到信息产品上aaaa,以彻底改变搜索aaa。

                                  TR

                                  回顾一年的工作aaaa,可以发现组织aaa,学术界和行业的时间和地点为威尼斯官网神奇立竿见影做出了贡献aaaa。 当美国标准局设计出这个问题时aaaaa,它强调了自然语言的问题(英语问题aaaaa,见上文)aaa,而不是简单的关键词查询aaaa。结果是这些问题很长并且非常适合段落检索aaaaa。 为了确保每个问题都有答案aaa,他们在就问题达成一致时过滤语言数据库aaaa。 这样aaaaa,句子和文本必须有类似的陈述aaaaa,客观地使段落匹配(甚至语句匹配)命中率高(实际上aaaa,只要是大量的文本aaa,就会出现类似的陈述)aaa。 想象一下aaaa,如果你只有一两个关键词aaaaa,找到可能包含答案的相关段落和句子要困难得多aaaa。 当然aaa,找到相应的段落或陈述只会大大缩小寻找答案的范围aaa,但这是威尼斯官网第一步aaaa。要真正锁定答案aaaaa,您需要进一步细化语句中的单词或短语aaaaa。 此时aaaa,在信息提取学者中成熟的实名标签技术才刚刚起步aaaaa。 为了争取问答系统竞赛的客观性aaaa,组织者刻意选择答案相对简单的问题aaaa,如姓名aaaaa,时间和地点aaaaa。 这对应于真实姓名标记的对象aaa,使得该技术的第一步有一席之地aaaa。 例如aaaaa,对于“Joe DiMaggio在哪一年编制他的56场比赛连胜纪录aaa?”这一问题aaaaa,段落声明搜索很容易找到类似如下的文字说明:Joe DiMaggio的56场比赛连胜是在5月15日之间aaaaa, 1941年和1941年7月16日aaaa。真实姓名标签系统也可以很容易地锁定1941年的时间单位aaaa。 对于确切问题的确切答案aaaaa,因此可以在大量文件中找到答案aaa,就好像大海捞针是神奇的一样aaaaa。在此过程中aaa,11年后aaa,IBM沃森研究中心成功开发出一种计算机问答系统aaa,该系统击败了人类大脑并赢得了电视智能大奖赛Jeopardyaaa!的冠军aaaaa,这在观众面前引起了轰动aaaaa。美国aaa,就像今年的电脑一样aaaaa。该计划与第一次赢得国际象棋锦标赛一样令人兴奋aaaaa。

                                  TR

                                  过去评分较高的问答系统结合了实名标签和段落搜索技术:它证明只要有大量文档aaaa,片段+网元技术就可以自动搜索简单的答案aaa。

                                  TR

                                  四aaaaa,现状

                                  1999年aaaaa,学术界赢得了威尼斯官网第一场战斗aaaa。作为胜利者aaaa,我们也度过了愉快的时光aaaaa,我们能够谋生aaa。来自该行业的风险投资家蜂拥而至aaaaa。 我很快在华尔街获得了1000万美元的风险资本aaa。那时aaaaa,感觉我正在创造一个工业革命的新时代aaaa。 不幸的是aaa,好景不长aaaa,互联网泡沫破灭aaaaa,IT行业陷入了萧条的深​​渊aaaaa,长期以来无法恢复aaaaa。 投资者渴望快速成功aaaa,收紧货币政策aaaaa,问答系统已经从行业的宠儿变成了被抛弃的孩子aaa。 主流行业中没有人对这项技术持乐观态度aaaaa。与传统的关键词索引和搜索相比aaa,问答系统不稳定aaaaa,不健壮aaa,难以扩展aaaa。该行业的焦点从深度转向广度aaa,并专注于增加指数aaa。覆盖范围aaa,包括所谓的深层网络aaaa。 威尼斯官网发展几乎已从行业中消失aaa,但这一新兴领域已在学术界扎根aaaa,并不断发展并成为自然语言研究的重要分支aaaaa。 IBM后来解决了扩展问题(使用数百台机器进行分布式并行处理)和自适应培训aaaaa,并为大奖赛做好了准备aaa。 与此同时aaa,学术界也开始总结各种类型的问答系统aaaaa。 常见的分类基于问题的类型aaaa。

                                  TR

                                  我们很多人都在中学语文班aaaaa,听老师强调阅读理解应该掌握几个WH的重要性:谁/什么/何时/何地/如何/为什么(谁做了什么时间aaa,地点aaaa,方式和原因aaaa?抓住这些WHaaa,我也掌握了文章的中心aaa。作为人类阅读理解的模拟aaa,设计问答系统也是回答这些WH问题aaaa。 值得注意的是aaaaa,这些WH问题很难并且可以分为两类:一些WH对应于实体名称aaaa,例如谁/何时/何地aaaaa,并且相对容易回答这些问题aaaaa,并且该技术是成熟的aaa。 另一类问题不是aaaaa,例如什么/如何/为什么aaaa,回答这些问题对问答学术界来说是一个挑战aaaa。 简要介绍以下三个主要问题aaaa。

                                  TR

                                  什么是Xaaaaa?问题的类型是所谓的定义问题aaa,例如什么是iPad IIaaaa? (也包括谁的定义:谁是比尔克林顿aaa?)aaaa。 这类问题的特点是问题短aaaa,除了问题词什么和联系词是什么(搜索词叫做停止词aaaaa,应该在搜索之前进行过滤aaaaa,问答系统用它来理解类型搜索前的问题)aaaa,只使用一个X作为输入对传统的关键字检索非常不利aaaaa。 回答这些问题的最低要求是带有扩展和种类(而不是单词或短语)的定义声明aaa。 由于任何人或物体与其他实体处于多种关系(记住aaa,马克思说人是社会关系的总和)aaaa,要真正理解这个实体aaaaa,要完美地回答这个问题aaaaa,一个简单的定义是不够的aaaa。最好将此实体的所有关键信息汇总在一起并提供全面的摘要(就像该人的简历与公司简介一样)aaa。可以说它真的回答了什么/谁是X的问题aaa。 显然aaaaa,这一步并不容易aaaa。传统的关键字搜索完全无能为力aaa。但是aaa,深度信息提取有助于实现这一目标aaaaa。希望可以提取和集成分散在文档周围的所有关键信息aaaa。

                                  TR

                                  How类型问题也不容易回答aaaa,它正在寻找解决方案aaaa。 同样的问题aaaaa,往往有多种解决方案aaa,如治疗疾病aaa,可以使用多种药物aaa,也可以使用其他疗法aaaaa。因此aaaaa,完美地回答这个How类型问题是问答社区公认的问题之一aaaa。

                                  TR

                                  “为什么”类型的问题是找出现象的原因或动机aaaaa。 这些原因是明确的aaaaa,更多是隐含的aaaaa,几乎所有的原因都不是简单的单词或短语可以清楚表达aaaaa,找到这些答案aaa,并以适当的方式将它们整合到用户中aaaaa,自然这是一个非常大的问题aaaaa。

                                  TR

                                  QuestionAnsweringSystem是一个Java实现的人机问答系统aaaaa,可自动分析问题并给出候选答案aaaa。

                                  TR

                                  TR

                                  本文转载自:dwz.cn/LULmq


                                  现在致电 0755-88820392 OR 查看更多联系方式 →