1. 搜索到问答的转变与挑战:从PC到移动,信息获取方式从搜索向问答转变,问答需求增长且更自然语言化。搜索问答面临复杂文档,机器阅读理解难度大,需精准找到答案结果并抽取答案,这对相关性和阅读理解能力要求更高。
2. 深度匹配技术
数据与问题特点:数据来源多样,用户输入与标准问法差异大。
方法分类与模型:基于句子表示和交互关系两类方法,模型有DSSM、CNN - DSSM、MV - LSTM、MatchPyramid等。多层模型中表示学习优于匹配学习,基于交互关系方法因引入强信息效果较好。公开数据集上深度匹配模型与传统BM25特征差距不大,但基于交互关系方法表现更优。
3. 机器阅读理解技术
发展历程与模型**:分2015年前后两个阶段,模型从传统方法向神经网络转变。R - NET、Google QANET等模型出现,QANET通过数据增强提升效果,KnReader融入常识知识。
面临问题与解决思路:事实类问答面临答案不存在及推理问题,可通过判断答案存在性和利用外部知识解决;非事实类问答因长文本易丢失信息,可通过融入长距离信息传递机制和判断答案存在性改进。相应提出EK - RNet和HM - LSTM模型。
展开剩余80%4. 语言模型预训练技术
Word Embedding缺陷与预训练方法:Word Embedding存在一词多义问题,预训练方法包括ELMO、OpenAI GPT、BERT等,利用大规模单语语料,可建模一词多义并缓解任务对模型结构依赖。
模型特点与效果:ELMO通过双向语言模型提供上下文相关词表示;OpenAI GPT用Transformer网络,有监督微调;BERT使用Transformer编码器,双向且有多种预训练任务。这些模型在多个任务上取得较好效果,如BERT在SQuAD2.0等任务中表现出色。
为深入贯彻落实中央金融工作会议、新“国九条”和国办“47号文”精神,持续做好绿色金融大文章,郑州商品交易所(简称“郑商所”)联合中国铁合金工业协会(简称“中铁协”)共同开展期货市场促进铁合金产业绿色发展暨“绿色助企”专项试点工作(简称“绿色助企”试点),推广铁合金绿色产品认证,助力铁合金行业绿色发展。
免责声明:我们尊重知识产权、数据隐私,只做内容的收集、整理及分享,报告内容来源于网络,报告版权归原撰写发布机构所有,通过公开合法渠道获得,如涉及侵权,请及时联系我们删除淮南股票配资,如对报告内容存疑,请与撰写、发布机构联系
发布于:广东省