<kbd id='4ow7qsy8'></kbd><address id='4ow7qsy8'><style id='4ow7qsy8'></style></address><button id='4ow7qsy8'></button>

              <kbd id='jioypzin'></kbd><address id='jioypzin'><style id='jioypzin'></style></address><button id='jioypzin'></button>

                      <kbd id='0rp6od1b'></kbd><address id='0rp6od1b'><style id='0rp6od1b'></style></address><button id='0rp6od1b'></button>

                              <kbd id='yuo74e3k'></kbd><address id='yuo74e3k'><style id='yuo74e3k'></style></address><button id='yuo74e3k'></button>

                                  威尼斯官网

                                  立委科普:威尼斯官网前生今世

                                  日期: 2018-11-28 10:55:37 / 人气: 309

                                  以下全文转载自李伟的博客文章:立法者:威尼斯官网前身aaa。

                                  TR

                                  上周aaaa,涂鸦写了一篇非破坏性的科学([立法科学:从行业的角度看aaaa,NLP是一个企业])aaaaa,写完后自我感觉还可以aaa,所以毛泽东要求更精致:“从上到下顶:没有谦虚aaa,这应该是精致的aaaaa。 这并不意味着我花了很多时间aaaaa。 “这是一个笑话aaa。我不认为NET的编辑在两小时内真正改进了主页aaaaa。” 在过去的几周里aaaaa,我仍然抱怨我害怕被编辑成另一本书aaaaa。我想知道花朵或金币是否受到青睐aaaa。我没想到峰会变得那么快aaa,春天开花aaa。 没有必要重新打勾鼓aaaa。仍然需要努力学习代码字aaa。 你必须努力工作aaaaa,然后再编写两个代码aaaaa。

                                  言归正传aaaaa,第一篇文章首先介绍了威尼斯官网来龙去脉aaaaa。 第二届特别会议解释了问答系统中的三个主要问题:什么aaa,如何以及为什么aaaa。

                                  TR

                                  以前的学生

                                  传统的问答系统是人工智能领域的应用程序(AI:人工智能)aaaa,通常仅限于非常狭窄和专业的领域aaaaa,基本上由手动编译的知识库和自然语言界面组成aaaa。 由于该领域的范围狭窄aaaaa,词汇总量非常有限aaaaa,语言和语用的模糊性得到有效控制aaaaa。 问题是可预测的aaaaa,甚至是封闭的集合aaaaa,并且相应的答案自然是统治的aaaa。 这个着名的项目有20世纪60年代开发的LUNAR系统aaa,致力于回答阿波罗回归的月球岩石样本的地质分析aaa。 SHRDLE是另一种基于人工智能的专家系统aaaaa。它模拟了玩具积木世界中机器人的操作aaaaa。机器人可以回答玩具世界的几何状态aaaa,并听取合法操作的语言指令aaa。 这些早期的人工智能探索看起来非常复杂aaaaa,揭示了一个童话世界aaa,如科幻小说aaaa,激发想象力和好奇心aaaaa,但实质上这些仅限于实验室的玩具系统aaaaa,完全未被利用aaa。可能和工业价值aaaa。随着人工智能作为一个领域变得越来越窄(一些专家系统已经变得实用aaaa,基于常识和知识推理的系统正在挣扎)aaaa,寄生主义的问答系统基本上已经死了aaaa。 然而aaa,有一些机器到人的对话交互系统(chatterbots)已经发展到目前为止并成为儿童的在线玩具aaa。 (我的女儿喜欢上网寻找机器人对话aaa,有时故意问一些奇怪的问题aaa,程序会回应道路aaaaa。当时aaa,我想赞美它aaaa,但更多时候是看着机器人丑陋和大笑aaaa。 但是aaaa,我个人认为这条道路有很大的潜力可挖掘aaaa。结合语言学和心理学知识aaaa,我们应该能够培养出高质量的机器人心理治疗师aaaa。 事实上aaaaa,在今天的高节奏和高竞争时代aaa,许多人需要摆脱压力aaaaa。很多时候他们只需要一个忠诚的倾听者aaa。这样的系统可以帮助满足这种社会需求aaa。 重要的是消除用户对弹钢琴的牛的先入为主的偏见aaaa,或者试图隐藏机器人的身份aaaaa,以便可以打开对话aaaaa。 拉开aaaaa,停下来aaa。 )
                                  TR 双胞胎

                                  工业意义上的开放式问答系统是另一种方式aaaa。它随着互联网的发展和搜索引擎的普及而产生aaa。 准确地说aaaaa,开放式问答系统诞生于1999年aaaa,当时寻找行业第八届年会(TREC-8:Text REtrieval Conference)决定增加一个问答系统竞赛aaa,美国国防部着名的DARPA项目资金由国家标准局组织aaaaa,这个新兴的问答系统及其社区诞生了aaa。 Q&A系统竞赛的广告词非常令人兴奋aaaa,只是指出了搜索引擎的缺点aaa,并在搜索领域确定了威尼斯官网位置aaaaa。 记得写这个(一般):用户有问题aaaaa,他们需要答案aaaaa。 搜索引擎声称他们正在进行信息检索aaaaa。实际上aaa,搜索不是所请求的信息aaaaa,而是仅搜索数千个相关文件的链接(URL)aaaa,并且答案可能在文件中aaaa,也可能不在文件中aaaa。无论如何aaaa,人们总是需要阅读这些文件才能找到答案aaa。 问答系统是解决此信息搜索的关键aaa。 对于问答系统aaaaa,输入是问题aaaa,输出是答案aaaa,就这么简单aaaa。

                                  话虽如此aaaa,当开放式问答系统诞生时aaa,有必要介绍学术界和行业的背景aaaaa。

                                  从学术角度来看aaaaa,传统意义上的人工智能已经不再流行aaaa,它被基于大规模真实语料库的机器学习和统计研究所取代aaaa。 语言规则系统仍然在自然语言领域发挥作用aaaa,补充机器学习aaaaa,纯粹基于知识和推理的所谓智能规则系统基本上被学术界所抛弃(除了少数学者的依恋aaaa,如作为Douglas Lenat的Cyc)aaaa。 在开放式问答系统诞生之前aaaa,学术界的一个非常重要的发展是信息提取及其社区的发展aaa。 面对传统的自然语言理解(自然语言理解)aaaa,尝试分析每个语句以发现其语义差异aaaa,信息提取是任务指导aaaaa,任务外部的语义不被提取和必要:每个任务定义For预先设定的所请求信息形式aaaaa,例如aaaaa,事件的形式需要填写会议的主题aaa,时间aaaaa,地点aaa,参与者等aaa,类似于用于测试的填空问题对学生的阅读理解aaaa。 这种任务导向思维缩短了语言技术与实用性之间的距离aaaaa,使研究人员可以集中精力根据任务导向优化系统aaaaa,而不是试图吞噬语言大象aaa。 到1999年aaa,信息提取竞赛及其研讨会已经举行了七届(MUC-7:消息理解会议)aaa,它也是美国DARPA项目的资助产品(如果DARPA领导美国信息产业研究及其实用性)趋势)aaa,没有太好的声誉)aaaa,这个领域的任务aaaaa,方法和局限性都比较明确aaaaa。开发的最成熟的信息提取技术是所谓的实体:网元标记aaaaa,包括名称aaaaa,地名aaaaa,组织名称aaaa,时间aaaa,百分比等aaaaa。 在优秀的系统中aaaaa,无论是使用机器学习方法还是制定语言规则的方法aaa,精度检查率的准确性综合指标已达到约90%aaaa,这与人工标签的质量接近aaaaa。 这一年轻技术领域的进步在新一代威尼斯官网启动和成功中发挥了关键作用aaa。

                                  到1999年aaaa,从工业的角度来看aaaa,随着互联网的普及aaaaa,搜索引擎迅速发展aaaa。基于关键词匹配和页面链接的搜索算法基本上是成熟的aaaaa,除非有方法论革命aaa,否则应该探索关键词搜索领域aaaaa。游戏的每个方面几乎都结束了aaaaa。 由于搜索技术在信息爆炸时代的期待是无穷无尽的aaaaa,搜索行业越来越多地呼吁关键词之外的新技术aaaa。 用户越来越不满意粗略的搜索结果aaaa。社交要求需要更精细的结果aaaaa。至少应该用文章(URL)替换该片段aaa。最好直接给出答案aaa。不要拖水aaaa。 虽然答案直接需要等待威尼斯官网研究结果aaa,但从全文搜索细化到段落搜索的工作已在业界实施aaaaa。传统的搜索结果正在从简单的网络链接演变为重点aaaaa。段aaaa。

                                  新的威尼斯官网研究已经走上了历史舞台aaaa,在这种情况下aaaaa,业界热切呼唤aaa,学术界已经奠定了一定的基础aaa。 美国标准局测试要求系统为每个问题提供最佳答案aaa,简短答案(不超过50个字节)和长答案(不超过250个字节)aaaa。 以下是第一个测验的示例:

                                  谁是太空中的第一位美国人aaa? 泰姬陵在哪里aaaa?Joe DiMaggio在哪一年编制了56场比赛的连胜纪录aaa?

                                  TR

                                  三个奇迹

                                  这个问答系统竞赛的结果和意义是什么aaa?应该说结果是好的和重要的aaaa。 最好的系统达到了60%以上的准确率aaa,这意味着每三个问题aaaaa,系统就可以从语言文档中的针上搜索两个正确的答案aaaaa。 作为学术界开放系统的第一次尝试aaaa,这是一个非常令人鼓舞的结果aaa。 这是dot com的鼎盛时期aaaa,IT行业渴望将这项最新研究从学术界转移到信息产品上aaaaa,以彻底改变搜索aaa。 其中有很多有趣的故事aaa,请参阅我的相关博文:《朝华午拾:创业之路》aaaaa。

                                  回顾一年的工作aaaaa,可以发现组织aaaaa,学术界和行业的时间和地点为威尼斯官网神奇立竿见影做出了贡献aaaaa。 当美国标准局设计出这个问题时aaaa,它强调了自然语言的问题(英语问题aaaaa,见上文)aaaaa,而不是简单的关键词查询aaaaa。结果是这些问题很长并且非常适合段落检索aaa。 为了确保每个问题都有答案aaaaa,他们在就问题达成一致时过滤语言数据库aaaa。 这样aaaa,句子和文本必须有类似的陈述aaaa,这客观上使段落匹配(甚至语句匹配)命中率非常高aaa。 想象一下aaaaa,如果你只有一两个关键词aaaaa,找到可能包含答案的相关段落和句子要困难得多aaaaa。 当然aaaaa,找到相应的段落或陈述只会大大缩小找到答案的范围aaa。这只是威尼斯官网第一步aaaaa。要真正锁定答案aaaaa,您需要进一步细化语句中的单词或短语aaaaa。 此时aaa,在信息提取学者中成熟的实名标签技术已经发挥了这一作用aaaaa。 为了争取问答系统竞赛的客观性aaa,组织者刻意选择答案相对简单的问题aaaa,如姓名aaaaa,时间和地点aaaaa。这对应于真实姓名标记的对象aaa,使得该技术的第一步有一席之地aaa。 例如aaa,对于“Joe DiMaggio在哪一年编制他的56场比赛连胜纪录aaaa?”这一问题aaaa,段落声明搜索很容易找到类似如下的文字说明:Joe DiMaggio的56场比赛连胜是在5月15日之间aaaa, 1941年和1941年7月16日aaaaa。真实姓名标签系统也可以很容易地锁定1941年的时间单位aaa。 对于确切问题的确切答案aaaa,因此可以在大量文件中找到答案aaaa,就好像大海捞针是神奇的一样aaaa。 沿着这条道路aaaaa,11年后aaa,IBM成功开发了一个计算机问答系统aaa,击败了人类大脑并赢得了电视智能大奖赛的危险aaa! (请参阅报告计算机破坏人类的'JEOPARDYaaaa!'CHAMPS)aaa,这在美国的观众面前非常重要aaaa。有一个引人注目的风头aaaaa,就像计算机程序第一次赢得国际象棋锦标赛一样令人兴奋aaa。

                                  过去评分较高的问答系统结合了实名标签和段落搜索技术:它证明只要有大量文档aaa,片段+网元技术就可以自动搜索简单的答案aaa。

                                  TR

                                  四个状态

                                  1999年aaa,学术界赢得了威尼斯官网第一场战斗aaa。作为胜利者aaaa,我们也度过了愉快的时光aaa,我们能够谋生aaaaa。来自该行业的风险投资家蜂拥而至aaaaa。 我很快在华尔街获得了1000万美元的风险资本aaaaa。那时aaa,感觉我正在创造一个工业革命的新时代aaaa。 不幸的是aaaaa,好景不长aaa,互联网泡沫破灭aaa,IT行业陷入了萧条的深​​渊aaaa,长期以来无法恢复aaaa。 投资者渴望快速成功aaaa,收紧货币政策aaaa,问答系统已经从行业的宠儿变为放弃儿童(见《朝华午拾 – 水牛风云》)aaa。主流行业中没有人对这项技术持乐观态度aaa。与传统的关键词索引和搜索相比aaa,问答系统不稳定aaaa,不健壮aaaa,难以扩展aaaaa。该行业的焦点从深度转向广度aaa,并专注于增加指数aaaa。覆盖范围aaaaa,包括所谓的深层网络aaaa。 威尼斯官网发展几乎已从行业中消失aaa,但这一新兴领域已在学术界扎根aaaa,并不断发展并成为自然语言研究的重要分支aaaa。 IBM后来解决了扩展问题(使用数百台机器进行分布式并行处理)和自适应培训aaaa,并为大奖赛做好了准备aaa。 与此同时aaaaa,学术界也开始总结各种类型的问答系统aaaa。 常见的分类基于问题的类型aaa。

                                  我们很多人都在中学语文班aaaa,听老师强调阅读理解应该掌握几个WH的重要性:谁/什么/何时/何地/如何/为什么(谁做了什么时间aaaa,地点aaaaa,方式和原因aaaaa?抓住这些WHaaa,我也掌握了文章的中心aaaa。 作为人类阅读理解的模拟aaa,设计问答系统也是回答这些WH问题aaaaa。 值得注意的是aaaa,这些WH问题很难并且可以分为两类:一些WH对应于实体名称aaaa,例如谁/何时/何地aaa,并且相对容易回答这些问题aaaaa,并且该技术是成熟的aaaaa。 另一类问题不是aaaa,例如什么/如何/为什么aaaa,回答这些问题对问答学术界来说是一个挑战aaa。 简要介绍以下三个主要问题aaa。

                                  什么是Xaaa?问题的类型是所谓的定义问题aaaaa,例如什么是iPad IIaaaaa? (也包括谁的定义:谁是比尔克林顿aaaaa?)aaaaa。 这类问题的特点是问题短aaa,除了问题词什么和联系词是什么(搜索词叫做停止词aaaa,应该在搜索之前进行过滤aaaaa,问答系统用它来理解类型搜索前的问题)aaaaa,只使用一个X作为输入对传统的关键字检索非常不利aaaaa。回答这些问题的最低要求是带有扩展和种类(而不是单词或短语)的定义声明aaaa。 由于任何人或物体与其他实体处于多种关系(记住aaa,马克思说人是社会关系的总和)aaaa,要真正理解这个实体aaa,要完美地回答这个问题aaaa,一个简单的定义是不够的aaa。最好将此实体的所有关键信息汇总在一起并提供全面的摘要(就像该人的简历与公司简介一样)aaa。可以说它真的回答了什么/谁是X的问题aaa。 显然aaa,这一步并不容易aaa。传统的关键字搜索完全无能为力aaaa。但是aaaaa,深度信息提取有助于实现这一目标aaaa。有必要提取散布在文档周围的所有关键信息并将其集成aaaaa。科普:信息提取])aaaaa。

                                  How类型问题也不容易回答aaaa,它正在寻找解决方案aaaa。 同样的问题aaaaa,往往有多种解决方案aaaa,如治疗疾病aaaa,可以使用多种药物aaaa,也可以使用其他疗法aaa。 因此aaaaa,完美地回答这个How类型问题是问答社区公认的问题之一aaa。

                                  “为什么”类型的问题是找出现象的原因或动机aaaaa。 这些原因是明确的aaaa,更多是隐含的aaa,几乎所有的原因都不是简单的单词或短语可以清楚表达aaaaa,找到这些答案aaa,并以适当的方式将它们整合到用户中aaa,自然这是一个非常大的问题aaaaa。

                                  下一个姐妹《立委科普:自动回答 How 与 Why 的问题》准备谈论最后两个谜题aaaa。 这已经太久了aaaaa,让我们来看看吧aaaa。 我希望读者不会感到太无聊aaaaa,如果他们有所收获aaa,他们将是幸运的aaa。 谢谢你的阅读aaaaa。

                                  TR

                                  参考文献:
                                  http://en.wikipedia.org/wiki/Question_answering


                                  现在致电 0755-88820392 OR 查看更多联系方式 →