<kbd id='3e5pr3xr'></kbd><address id='3e5pr3xr'><style id='3e5pr3xr'></style></address><button id='3e5pr3xr'></button>

              <kbd id='itrwfl59'></kbd><address id='itrwfl59'><style id='itrwfl59'></style></address><button id='itrwfl59'></button>

                      <kbd id='6mypvph7'></kbd><address id='6mypvph7'><style id='6mypvph7'></style></address><button id='6mypvph7'></button>

                              <kbd id='31aufy45'></kbd><address id='31aufy45'><style id='31aufy45'></style></address><button id='31aufy45'></button>

                                      <kbd id='165wr80a'></kbd><address id='165wr80a'><style id='165wr80a'></style></address><button id='165wr80a'></button>

                                              <kbd id='lfvdqkbc'></kbd><address id='lfvdqkbc'><style id='lfvdqkbc'></style></address><button id='lfvdqkbc'></button>

                                                  威尼斯官网

                                                  语音问答系统研究分析

                                                  日期: 2018-11-08 09:47:21 / 人气: 463

                                                  由于工作的需要aaa,我准备启动语音问答系统aaaaa。我之前没有触及语音和自然语言处理(NLP)aaaa,因此从一开始就很难开始aaa。花了大约两个星期才得到一般性的理解aaaaa,适合像我这样的新人aaa。我借了n个更多神的内容aaaa,并给了更好的页面aaaa,课程等aaaaa。如果你侵犯了aaa,请联系删除aaa。 aaaaa。 aaa。 TR TR 对话系统框架
                                                  TR 第二研究内容
                                                  语音识别 - 语音识别aaaaa,SR
                                                  聊天问答系统 - Chitchat-bot
                                                  知识库问答 - 知识库问答aaa,KB-QA
                                                  垂直场QA
                                                  三循环神经网络(RNN)基本型
                                                  在语音识别和问答系统中aaa,使用循环神经网络(RNN)是必不可少的aaaa。这里没有详细介绍该算法aaaa。只给出了应该学习的基本类型和网络结构及其更好的学习资源aaa。 TR TR TR 上图是RNN的基本类型aaaa,以下是其输入输出及其作用的一般描述aaaa。 TR 一对一:给出一个输入aaaa,得到一个输出aaaaa,是基本的网络结构aaaa,不包含序列信息aaaa,比如我们常用的图像分类
                                                  一对多:给出输入aaaaa,获得一系列输出aaaaa,可用于图像标题生成aaa,输入图像aaaaa,输出图像的文本描述
                                                  多对一:提供一系列输入并获得可用于文本情感分类的输出aaaa,例如分析文本是正还是负aaaaa。 多对多:第四个图像aaa,输入和输出的序列数量不一定相同aaaa,可用于机器翻译aaaaa,问答系统等aaaa。
                                                  多对多:第五个图像aaaaa,输入和输出具有相同的序列号aaaaa,可用于字符预测aaaa,标记视频帧等aaaaa。 需要提前理解的网络结构是RNNaaaaa,LSTM和注意机制aaaa。建议李洪义老师的课程:
                                                  http://speech.ee.ntu.edu.tw/~tlkagk/courses_MLSD15_2.html
                                                  TR 对过去和现在生活的四种声音识别
                                                  过去的生活 TR 从1990年到2010年aaaaa,语音识别大多采用上述框架aaa,下面简要分析框架的上述部分aaaa。 TR 预处理:
                                                  1.头部和尾部的无声切除aaa,以减少后续步骤造成的干扰aaaaa。静音切除的操作通常称为VAD(语音激活检测); 2.声音取景aaa,即将声音切割成一个短片段aaaa,每个片段称为一个帧aaa,使用移动窗口功能来实现aaaaa,而不是简单的剪切aaaa,帧一般重叠;
                                                  TR 特征提取:
                                                  主要算法是线性预测倒谱系数(LPCC)和梅尔倒谱系数(MFCC)aaa,目的是将每个帧波形转换为包含声音信息的多维向量; TR TR 声学模型(AM):
                                                  通过训练语音数据获得aaa,输入是特征向量aaaaa,输出是音素信息;常用的算法是GMM + HMM; TR 词典:
                                                  单词或单词与音素之间的对应关系aaa。简单来说aaaaa,汉语是拼音和汉字之间的对应关系aaaa,英语是拼音符号和单词之间的对应关系; 语言模型(LM):
                                                  通过训练大量文本信息aaa,获得单个单词或单词彼此相关的概率;常用的算法是:n-gram模型; 解码:
                                                  也就是说aaaa,通过声学模型aaa,词典和语言模型输出所提取的特征的音频数据;TR 上述模块涉及很多知识aaa。在这里aaa,我列出了我认为更好的链接aaaa。我已经复制了其中的一些aaa,但为了尊重原文aaa,我仍然给出原始链接:
                                                  TR 有关MFCC算法aaaaa,请参阅:https://www.cnblogs.com/BaroC/p/4283380.html
                                                  https://blog.csdn.net/xueyingxue001/article/details/53183757
                                                  TR 有关GMM + HMM算法的详细信息aaaa,请参阅:https://blog.csdn.net/davidie/article/details/46929269和https://www.zhihu.com/lives/843853238078963712
                                                  N-gram模型请参见:https://blog.csdn.net/ahmanz/article/details/51273500
                                                  这一生 这种生活主要受益于神经网络aaaaa。主要思想是使用DNN来获取原始模块aaa,或者进行最终的大融合aaaa。 TR TR TR TR TR 如果您想了解更多相关信息aaaaa,请参考以下链接:
                                                  TR 有关如何将声波模型转换为可输入神经网络的矢量aaa,请参阅https://zhuanlan.zhihu.com/p/24703268
                                                  有关过去和现在的语音识别及其算法的详细说明aaaaa,请参阅https://www.zhihu.com/lives/843853238078963712
                                                  五种聊天型问答系统
                                                  Seq2Seq
                                                  在引入八卦问答系统之前aaaa,你必须问系统之星:Seq2Seq
                                                  TR 模型结果如下:
                                                  TR TR 每个单元是一个循环神经网络aaa,如:RNNaaaa,LSTMaaaa,GRU等aaa,LSTM大多数; Seq2seq属于编码器 - 解码器结构之一aaa。编码器将可变长度信号序列转换为固定长度矢量表示aaaaa。解码器将该固定长度矢量转换为可变长度目标信号序列aaa。 TR 该模型有许多变体aaaaa,例如添加注意机制aaaa,内存模型等aaa。 TR 说明:以前的模型是训练模式aaa,即解码器的输入是基础事实aaa,最后一个模型是部署模式aaaaa。在测试时aaaa,解码器的输入是前一时刻的输出aaa。 TR 聊天问答系统框架
                                                  分词
                                                  概念
                                                  a)中文分词是指将汉字序列分成单个单词aaaa。分词意味着连续的词序 根据特定规范将列重组为单词序列的过程aaaa。 TR 中文分词方法
                                                  a)基于分词的分词方法
                                                  b)基于理解的分词方法(在实验阶段)
                                                  c)基于统计的分词方法
                                                  d)在实际使用中与a)和c)结合使用
                                                  中文分词工具
                                                  杰巴分词aaaaa,SnowNLPaaaa,THULACaaaa,NLPIR
                                                  TR Word嵌入
                                                  概念
                                                  a)是单词的类型表示aaaa,具有相似含义的单词具有相似的表示aaa,将单词映射到实数数量的一般方法aaaa。 TR 一热编码
                                                  a)将单词表示为一个很长的向量aaa,单词的维度是词汇量大小aaaa,大多数维度为0aaa,只有一个维度是
                                                  1
                                                  b)“可爱”[0 0 0 1 0 0 0 0 0 0 0 0 0 0 ......]
                                                  常用算法
                                                  a)word2vec:有关详细算法aaaaa,请参考http://www.dataguru.cn/article-13488-1.html Skip-gram和CBOW算法的详细说明和培训过程aaa,请参考cs224d视频第二课的内容aaa。 TR Seq2Seq
                                                  工具
                                                  a)Tensorflow embedding_attention_seq2seq API接口
                                                  b)有关接口参数aaa,请参阅http://www.shareditor.com/blogshow?blogId=136
                                                  c)界面包含单词嵌入和注意机制aaaaa。 TR d)seq2seq详细算法说明请参考https://blog.csdn.net/Irving_zhang/article/details/78889364
                                                  TR 自然语言生成(Word嵌入)
                                                  算法
                                                  a)贪婪搜索:输出输出序列的每一步中最可能的单词
                                                  b)波束搜索:返回最可能的输出序列列表
                                                  c)有关详细信息aaa,请参阅:https://www.sohu.com/a/159397046_206784
                                                  TR 知识库问答系统(KB-QA)
                                                  概念
                                                  鉴于自然语言问题aaa,通过对问题的语义理解和分析aaaaa,知识库用于查询和推理得到答案aaa。 TR TR 应用场景
                                                  适用于回答事实aaaaa,问题等事实问题aaaaa。答案是知识库中的实体或实体关系aaaaa。 TR 知识库
                                                  使用三重存储(实体实体aaa,实体关系aaaaa,实体)aaaa,如(姚明aaaa,出生地aaaa,上海)
                                                  TR 主流方法
                                                  语义语义分析 这个想法是将人类使用的自然语言句子翻译成机器可以理解的逻辑形式aaaa,并通过数据库获得答案aaa。 TR 信息提取
                                                  该想法是使用上述特征训练分类器对候选答案进行排序aaaaa,以通过提取句子中的特征信息和知识库中相关实体的特征信息来获得答案aaaaa。 TR 矢量建模
                                                  这个想法是将知识库的实体和自然语言句子都映射到同一个向量空间aaaa,并通过比较相似性找到答案aaaaa。 TR TR 深度深度学习 应用于语义分析aaa,矢量建模;使用记忆网络aaaaa,注意机制
                                                  动态模型
                                                  我们的想法是通过解析问题aaa,使用不同的问题来预定义一些网络模块aaaa。 该模块结合了动态模型来回答aaaa。 TR 参考文献
                                                  知道列https://zhuanlan.zhihu.com/p/27141786
                                                  TR 垂直场QA
                                                  对话系统
                                                  TR 基于搜索的对话系统(面向任务的新问答系统)
                                                  TR 模式:s1aaa,s2-> Raaaa,即字符串s1和s2符合某些规则aaaa。 预先预先存储用于回复的数据aaaa,其优点是不会说出回复的内容aaa。法律和语义错误;
                                                  缺点缺点:不会创建新的答案aaa,也不会回答未经训练的问题 TR 基于生成的对话系统(chitchat-botaaaa,KB-QA)
                                                  模式:s1-> S2aaaa,即s2从字符串s1获得 TR 趋势
                                                  具有上述两个功能的混合对话系统
                                                  TR 说明
                                                  大多数问题用于计算与现有问题的语义相似度aaa,并对最相似的问题进行排序aaaa,然后使用问题的响应句来回答用户;
                                                  https://blog.csdn.net/coder_oyang/article/details/72731419涉及知识地图
                                                  http://www.sohu.com/a/115593961_465975http://www.sohu.com/a/140243692_500659 2017年之前更好的搜索对话文件(你可以通过这个关键词找到新的关键词)
                                                  https://zhuanlan.zhihu.com/p/31638132示例
                                                  摘要
                                                  当相关知识相对复杂且基础知识相对缺乏时aaaa,开始学习可能没那么有意义aaaa。知道知识点可能需要大量信息;
                                                  传统方法越来越难以理解;但不要气馁aaa,不断学习可以永远掌握aaa。 ---------------------
                                                  作者:勤奋凌飞 资料来源:CSDN
                                                  原文:blog.csdn.net/Suan2014/article/details/82699271
                                                  TR

                                                  现在致电 0755-88820392 OR 查看更多联系方式 →