我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:2019跑狗图高清彩图 > 约束推理 >

基于概率软逻辑模型的实体解析pdf

归档日期:07-08       文本归类:约束推理      文章编辑:爱尚语录

  1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

  第 卷 第 期 计 算 机 工 程 年 月 人工智能及识别技术 文章编号 文献标志码 中图分类号 基于概率软逻辑模型的实体解析 宫云宝甘 亮黄九鸣 国防科学技术大学 计算机学院长沙 摘 要 在马尔科夫逻辑网 的实体解析算法中任意闭原子采用硬约束导致推理及权重学习过程较难收敛 到最优解降低解析精度及执行效率 为此提出一种将概率软逻辑模型应用到实体解析中的方法该模型 中闭原子采用软约束易于进行知识推理与权重学习 阐述 模型基本理论通过实体关系实体属性本体约 束构造 模型的逻辑规则描述实体解析的匹配过程根据 模型的推理机制实现实体解析的决策过程 实 验结果表明与基于 的实体解析算法相比该方法可大幅提高实体解析的准确率 值及执行效率 关键词 实体解析概率软逻辑马尔科夫逻辑网实体关系实体属性本体约束 中文引用格式宫云宝甘亮黄九鸣基于概率软逻辑模型的实体解析计算机工程 英文引用格式 度得分判断这 个实体是否表示同一实体这种判 概述 断也称为匹配决策 对于实体属性集合每个需要 实体解析 也称为实体对 匹配的候选实体属性对都需要进行匹配决策并针 齐或实体匹配是判断相同或不相同数据集中的 个 对不同属性进行相应调整 最后利用传递闭包规 实体是否指向真实世界同一个对象的过程 近 则和回归 模型 年来问题及算法已引起国内外数据挖掘信 以保证实体的一致性 当前 研究领域主流的 息融合等领域的学者们的高度关注同时实体解析 个研究方向是 多个数据源进行实体解析如何 技术已广泛应用到医疗系统银行管理系统以及大 有效避免指数增长式的匹配 运用无监督学习技 规模知识库构建等领域 文献 提出实体解析问 术减少对训练数据集的依赖 题文献 提出模型该模型给出一 近年来有相关研究者指出多数据源中实体之 套简洁的实体解析统计学表示形式 传统实体解析 间进行相互独立匹配是不合理的 事实上数据集 算法都是基于 模型演化出的通过实 中的实体之间并非孤立而是存在内在联系的 尽 体的属性集计算出 个实体相似度得分利用相似 管实体之间内在关系会导致知识推理以及知识学习 作者简介宫云宝 男硕士研究生主研方向为知识图谱 自然语言处理甘 亮讲师博士后黄九鸣讲师博士研究生 收稿日期 修回日期 第 卷 第 期 宫云宝甘 亮黄九鸣基于概率软逻辑模型的实体解析 的复杂性但是通过实体之间的内在关系可以很好 在上述逻辑规则中表示原子变量式 地提高实体匹配的性能 传统 模型是 表示是朋友之间可能会投票给同一个人式 表示 采用独立匹配策略因此研究者提出了相应模 夫妻之间可能会投票给同一个人权重可以判断出 型来代替原有模型 文献 在构建实体解析模 夫妻之间投票结果的相互影响比朋友之间投票结果 型时均考虑实体之间的关系对实体解析结果影响 的相互影响更大些 文献 基于马尔科夫逻辑网 模型提供丰富相似度计算 函数 例如 理论提出一套完备而简洁的实体解 距离 相似度 在本文的应用程 析问题模型为非独立且非均匀分布类型的数据提 序中利用谓词相似性可以产生一些推理规则如 供了高效的推理和学习算法 然而马尔科夫逻辑 式 所示 网解决 问题存在一些不足之处例如在 模型中所有闭原子以及闭规则成立概率取值均是 布尔值 引起原子变量组合爆炸式增长 降低了 模型中每个闭原子 的概率取值是 的推理以及学习的性能增加了求解模型最优 之间连续值记为 闭逻辑规则 成立概率记 解的难度 本文针对 解决 问题存在的不 为 当计算 时通常采用 的合 足提出基于概率软逻辑 取 析取 否定 作为逻辑连接词 模型的实体解析方法通过阐述 模型理论 以及构造 模型实现实体解析过程 相关工作 可以将一条逻辑规则 等价表示成 马尔科夫逻辑网 当 时这条规则 被满足即 年 美 国华 盛 顿 大 学 的 和 否则定义距离满意度来衡量逻辑规则被 提出了马尔科夫逻辑网 是将马尔 满足概率 科夫网络与一阶逻辑规则相结合的一种全新的统计 关系学习模型 基本思想是让硬性逻辑规则有 例如假设存在一个数据集其中 所松弛即当一个世界违反了其中的一条逻辑规则 那么这个世界存在的可能性降低但并非不存在 为 可以计算出逻辑规则式 的距离满 此给每个逻辑规则都加上了一个特定的权重它反 意度 映了对满足该规则的可能世界的约束力 模型 常用推理机制有 种一种是最大可能性推理问题 研究人员提 出 的常用算 法有 及 另一种重要的推理形式是计算边缘和条件 根据距离满意度定义概率分布计算出所 概率研究人员提出的常用算法有 有闭原子的解释概率值定义如下 等 等人提出了一种基于 的实体解析方 [ ] 法但是由于 的推理机制性能不足导致实体解 析的结果以及执行效率无法令人满意 概率软逻辑 其中表示规化因子 表示规则 权重表示所 年美国马里兰大学的 等人提出 有规则集合 表示 种不同损失函数在本 了概率软逻辑模型 该模型采用带有权重 文的应用程序中 的一阶逻辑规则将概率图 与一阶逻辑规则 相 的推理机制主要采用 结合提供有效概率推理机制 模型的最大特 推理 推理能够计算出测试数据 点在于闭原子采用软约束 即闭原子概率取值是 集中所有闭原子的解释最大概率值 本文认为闭 之间连续值而不是 布尔值这个特点是 原子的最可能解释是指最高概率值的解释与最低 以及其他概率模型不具有的 概率值的解释之间的距离满意度即闭原子该解释 模型采用带有权重的 一阶逻辑规则 尽可能满足所有的逻辑规则 从式 可以看出 进行如下定义 解释的最大概率值是规划因子 当 时所 有 计算转化成线性方程求解问题然后利用 线性规划求出距离满意度最小和当 时 推理 被 证 明是 一 个 计 算 机 工 程 年 月 日 基于的实体解析过程 的匹配过程 本文认为 比更适合应用到实体解 本文基于实体属性构建以下逻辑规则分别 析过程中主要基于以下原因 针对实体解析的复 考虑实体的重要属性与一般属性例如 杂匹配和决策过程模型的任意闭原子采用软 约束增强推理机制与权重学习性能加速实体解析 过程的最优解收敛速度 模型提供有效相似 计算能够较好地计算实体解析过程中属性值之间 相似性 最初版本是 等人于 年 提出基于相似函数的概率相似逻辑 随后概率相 似逻辑被证明能够较好地解决在记录链接以及数据 逻辑规则式 表示当实体 和 具有相同 时和可能表示同一个实体其中 表示 库的记录噪音问题 本文基于概率软逻辑模型设计一个实体解析 该逻辑规则权重 实现框架如图 所示 逻辑规则式 表示当实体 和实体 同属一 个类别且具有相似名字时 和 可能表示同一个 实体其中表示该逻辑规则权重 表示计算与 相似度的相似函数 本文采 用 距离作为该相似度函数 逻辑规则式 表示当实体 和实体 具有相 同属性以及相似属性值时 和 可能表示同一个 实体其中 表示该逻辑规则权重 表示计算 与 相似度的相似函数 本文采 用 集合相似计算作为该相似度函数 基于实体关系构建逻辑规则本文通过考虑 图 概率软逻辑模型基本框架 实体之间的内在联系能从一种类型的实体解析中 获取对另一种实体相关实体解析的有用信息如 逻辑谓词表示 根据数据集中实体属性实体关系以及本体相 关约束 个方面进行逻辑谓词声明 基于实体属性的逻辑谓词表示方法当面向 多个数据源利用实体解析技术进行融合过程时实 体属性集合大小往往超过 数量级如果对集合元 逻辑规则式 表示当实体 和实体 与实体 素依次进行表示将导致逻辑规则数量爆炸式增长 具有相同关系时和可能表示同一个实体其 本文通过考虑数据集每个实体属性对实体解析的结 中 表示该逻辑规则权重 果影响将实体属性划分成重要属性和一般属性 逻辑规则式 表示实体 和实体 是同一个 重要属性采用实体属性名称进行表示一般属性采 实体且实体和 关系与实体和 关系相同时 用 表示 本文选取实体名字以及实体类 实体 和 表示同一个实体其中 表示该逻辑 别作为重要属性即表示实体 的名字 规则权重 是 表示实体 的类别是 针对一般 基于本体约束构建逻辑规则如 属性采用统一谓词表示即 表示 实体存在属性 且该属性值为 基于实体关系的逻辑谓词表示方法采用 表示实体 和实体 之间关系 是 基于本体相关约束的逻辑谓词表示方法如 下 表示实体所属类别不能同时是 和 表示实体的类别 是 的子类 表示实体所属于领域为 逻辑规则式 表示当实体 和实体 的所 逻辑规则构建 属类别不能同时表示同一个实体时实体 和实体 依据上述声明实体与本体相关描述逻辑谓词以 表示不同一个实体其中 表该逻辑规则权重 及相似度计算函数建立逻辑规则来实现实体解析 逻辑规则式 表示当实体 和实体 的类 第 卷 第 期 宫云宝甘 亮黄九鸣基于概率软逻辑模型的实体解析 别具有相同父类时和可能表示同一个实体其 测试数据 该数据来 自于 中 表示该逻辑规则权重 项目包括了关于演员运动员和企业公司 逻辑规则式 表示当实体 和实体 的类 的数据 该数据集是由 个子目录组成每个测试 别具有相同域时 和 可能表示同一个实体其 目录包含 多个实体以及 多条事实组成 中 表示该逻辑规则权重 该数据集的数据格式采用和文件本文采 推理与权重学习 用 进行数据解析提取出实体描述与本体约束 模型提供 种有效推理方法第 种是最 信息 同时该数据集为了能够很好地从不同方面 大概率推理 根据已有数据集推断逻辑规则 反映算法性能提供 种数据修改策略 中原子最有可能正确的值第 种是边际概率推理 目录 实体 随机进行修改其他部分无 计算出闭原子概率取值的区间本文采用 模型 变化 中推理机制 由于原子概率取值采用连续数 目录 实体属性值进行随机修改 值使得 推理求最优解过程可以转换成凸优化 目录 实体属性结构发生转变即将 求解同时通过 实体的数据属性值随机修改成对象属性值以及一 能够有效且并行计算出 个实体 个属性值分成多个属性值 相似最优解 目录 实体逻辑转换即同一个实体 模型权重学习上选择最大似然参数估计 属于不同类别以及子类实例化成不相交的 个类 法应用梯度函数进行权重参数估计 别等 目录 上述几种修改策略组合 [ ] 实验过程中选取每种修改策略下 的文件目 录对 模型和 模型进行训练 的文件 其中 表示所有带有权重 被初始化的逻辑规 目录作为测试样例 则 由于计算 是 难问题 评价指标 [ ] 本文为了能够更好地评估实验结果选取准确 因此采用 近似代替 表示原子最有 率 召回率 值作为实验评判 可能的正确解释 指标计算公式如下 概率分布 正取的记录匹配对数 准确率 结合声明逻辑谓词与构造逻辑规则集合定义一 预测的记录匹配对数 个关于实体解析的 模型 模型概率分布如 正取的记录匹配对数 召回率 真实的记录匹配对数 式 其中是 模型中逻辑规则集合 表 准确率 召回率 示逻辑规则 的权重表示规划因子 表示逻 准确率 召回率 辑规则 的距离满意度 表示采用一阶逻辑规 在效率方面通过对比模型与 模型 则 定义 模型输入是测试数据集中实体属性 权重学习以及推理时平均运行时间进行性能分析 实体关系以及本体约束利用输入数据集初始化 结果分析 模型中逻辑规则进行权重学习然后 模型 利用真实数据集 及 节中提出的 种 中定义距离满意度计算出每条被初始化逻辑规则被 评测指标得到本文提出的基于 模型的实体解 满足的概率最后应用 推理机制计算出 个实 析与基于 实体解析的准确率召回率以及 体是表示同一个实体的概率 值如表 表 所示分别代表采用不同数据修改 策略下实验结果 为了对比模型运行效率得到 [ ] 模型与模型在实体解析过程的执行时间 如图 图 所示 选定 个合理的阈值是影响模型 有效性的关键本文选取 作为域值即当 个 实验与结果分析 实体相似度大于或等于 时认为这 个实体表 本文实验的目的是检验概率软逻辑在实体解析 示的是同一个实体 通过表 表 可以分析出不 中的效果为此设计了 个实验 基于模型的 同修改策略会影响模型的运行结果即越复杂的数 实体解析该实验平台采用马里兰大学提供的模 据修改策略对实验结果影响越大以其中数据修改 型框架 基于模型的实体解析的对照实验采 策略 对实验结果影响最大是因为数据属性转化 用华盛顿大学人工智能小组提供的 平台 成对象属性值会导致容易违反上述逻辑规则 与此 实验数据集 同时模型相比模型的实体解析的准确率 实验数据集采用 的是 以及 值有大幅提高 计 算 机 工 程 年 月 日 表 修改策略 数据集下 种模型的实验结果 总体来说本文的贡献有如下 点 模型 准确率 召回率 系统阐释的基本理论以及与优缺 点对比 基于实体属性实体关系以及本体约束构建 的一阶逻辑规则利用一阶逻辑规则表示实体 表 修改策略 数据集下 种模型的实验结果 解析的匹配过程以及 的推理机制实现实体解 模型 准确率 召回率 析的决策过程 在真实数据集进行实验与对照实验结果表 明本文提出的基于 模型在实体解析与传统的 概率统计模型相比具有良好效果 表 修改策略 数据集下 种模型的实验结果 结束语 模型 准确率 召回率 实体解析是数据挖掘信息融合的关键步骤特 别是针对多个数据源进行数据融合时实体解析技术 起到了重要的作用 数据源中的实体分布是非独立 表 修改策略 数据集下 种模型的实验结果 非均匀的同时传统 模型在解决该类问题存在 模型 准确率 召回率 不足本文提出一种基于模型的实体解析方法 通过阐述的基本理论以及构造实体解析的 模型旨在解决实体非独立非均匀分布的实体解析 实验结果表明模型能够较好地应用于实体解析 过程同时执行效果及执行效率有明显提高 虽然 通过图 图 可以看出模型在权重学习 模型易于进行百万条知识推理能够实现实体解 以及推理所花费时间比模型有所降低运行效 析但随着数据源的数据量不断增大模型的推 率大幅提高这是由于上述 模型内在特点加速 理性能较差同时构建合理有效的模型的逻辑规 推理过程收敛速度 最后在 种数据修改策略下 则也将面临巨大挑战 因此本文下一步基于模 本文提出应用 模型的实体解析方法切实有效 型的实体解析研究主要集中以下 个方面 将分区 相比应用 模型的实体解析方法的执行效果及 技术与模型相结合解决大规模的实体解析问题 执行效率都有很明显提高因此更适合应用于实体 自动抽取数据中的逻辑规则构建模型 分布是非独立非均匀的实体解析过程中 参考文献 朱 灿曹 健实体解析技术综述与展望计算 机科学 庄 严李国良冯建华等知识库实体对齐技术综 述计算机研究与发展 图 模型与模型的权重学习平均执行时间对比 图 模型与模型的推理平均执行时间对比 下转第 页 第 卷 第 期 王路辉王桂玲基于车牌识别流数据的伴随车辆发现算法 从而减少内存消耗如将车牌号和监测点的信息映射 到一张图中对图进行计算或利用 可以大幅减 少空间占用 对于流数据的处理采用增量式处理的 方式避免部分数据的重复计算 参考文献 薛如冰关联分析在涉案伴随车辆挖掘中的应用研 究北京北京交通大学 孙利民于重重吴子臖等一种针对特定车辆潜在 的群体的行驶轨迹预测 赵卓峰卢 帅韩燕波一种基于海量车牌识别数据 的车辆相似轨迹查询方法计算机与数字工程 曹 波韩燕波王桂玲一种基于海量车牌识别数据 的伴随车辆组发现方法 计算机应用 编辑 顾逸斐 上接第 页 顾慧翔俞 勇基于领域本体和知识推理的语义互 联网应用 上海交通大学学报 楼俊杰徐从富郝春亮等基于马尔科夫逻辑网络 的实体解析改进算法计算机科学 张宏毅王立威陈瑜希等概率图模型研究进展综 述软件学报 编辑 索书志

  ·基于改进sift的视频超分辨率重建快速配准算法研究-湖北民族学院.pdf

  ·基于电液悬挂系统的拖拉机主动减振控制-ingentaconnect.pdf

  ·基于改进的pid算法的压电柔性机械臂振动主动控制-西北工业大学.pdf

  ·基于改进的自适应粒子群算法的给水管网优化设计-北京工业大学学报.pdf

  ·基于格子boltzmann方法的液滴沿固壁铺展动态过程模拟-物理学报.pdf

  ·基于滑模控制的充液航天器燃料晃动抑制研究-openrepositoryof.pdf

  “原创力文档”前称为“文档投稿赚钱网”,本网站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有【成交的100%(原创)】

本文链接:http://ksbuilders1.com/yueshutuili/236.html