信息网络在话题识别与追踪中的应用研究
本书特色
[
向量空间检索模型在话题识别与追踪领域的成功应用,从理论上证明用于信息检索的贝叶斯网络模型亦可用于该领域。信念网络模型属于基于贝叶斯网络的检索模型的一种,专著围绕该思想,将其用于话题识别与追踪模型的构建,为该领域提出新的研究方法。考虑到新闻报道的特殊性,在文本处理阶段,将在基本互信息的基础上,提出融合聚类思想和时间距离的新闻话题特征选择方法,用于计算新闻报道中术语的权重。为了获得每个话题的初始特征子集规模,给出基于类内距离*小、类间距离*的目标函数,并采用坐标下降法对其求解结合信念网络模型和新闻报道的特点,给出四个基于信念网络的话题模型BSTM-I、BSTM-II、BDTM-I和BDTM-II。BSTM-I、BSTM-II属于静态话题模型,其区别是节点层数、类型。BDTM-I属于动态话题模型,节点类型和弧的意义与静态模型相同,不同的是在话题追踪过程中,其术语层会随着话题的发展而不断更新,包括术语权重的更新和术语节点的插入、删除。以上三个话题模型沿用了传统建模思想,具备和以往模型相同的优缺点。BDTM-II打破传统建模的思想,运用信念网络模型提供了一个灵活框架的优势,将术语节点分为两类:初始核心术语节点和更新术语节点,并采用析取手段将它们作为两类证据进行归并。依据模型的拓扑结构、贝叶斯概率和条件独立性假设给出了上述四个话题模型的概率推导。*后,专著将在上述内容的基础上,进行基于信念网络的话题模型优化研究,以期进一步提高模型的综合性能。
]
内容简介
[
《信念网络在话题识别与追踪中的应用研究》可以作为高等院校信息管理与信息系统、计算机科学与技术、管理科学与工程、情报学和图书馆学等专业研究生的教材,也可以作为相关领域研究人员的参考书。
]
目录
前言第1章 绪论1.1 研究背景1.2 研究现状1.2.1 话题识别与追踪研究现状1.2.2 话题识别与追踪模型研究现状1.2.3 信念网络及应用研究现状1.3 研究内容与研究目标1.4 本书主要创新点1.5 组织结构第2章 研究基础2.1 测试集合及评测标准2.1.1 测试集合2.1.2 评测标准2.2 话题识别与追踪相关研究2.2.1 发展历程2.2.2 相关概念2.2.3 研究任务2.2.4 实现方法2.2.5 经典话题模型及扩展研究2.3 贝叶斯网络理论2.3.1 贝叶斯网络的概率基础2.3.2 贝叶斯网络的结构2.3.3 贝叶斯网络的推理2.3.4 基于贝叶斯网络的信息检索模型2.4 本章小结第3章 话题特征选择3.1 引言3.2 特征选择理论3.2.1 基于搜索策略的特征选择方法3.2.2 基于评价准则的特征选择方法3.3 基于ITF-IDF的话题特征选择3.4 坐标下降法3.5 基于聚类的互信息3.6 基于DCMI的话题特征选择3.6.1 动态互信息3.6.2 特征子集规模的确定3.7 实验与分析3.7.1 目标函数求解3.7.2 DCMI和BMI性能比较3.7.3 DCMI和ITF-IDF的追踪性能3.7.4 实验分析3.8 本章小结第4章 基于信念网络的静态话题模型4.1 引言4.2 静态话题模型理论4.3 基于信念网络的静态话题模型Ⅰ4.4 基于信念网络的静态话题模型Ⅱ4.4.1 建模基础4.4.2 模型拓扑结构及概率推导4.5 实验与分析4.5.1 实验过程4.5.2 实验结果及分析4.6 本章小结第5章 基于信念网络的动态话题模型5.1 引言5.2 动态话题模型理论5.2.1 自适应学习理论5.2.2 增量式学习算法5.2.3 结构化话题模型的动态变形5.3 基于信念网络的动态话题模型Ⅰ5.4 基于信念网络的动态话题模型Ⅱ5.5 实验与分析5.5.1 实验过程5.5.2 实验结果5.5.3 实验分析5.6 本章小结第6章 误报检测用于优化基于信念网络的动态话题模型Ⅱ6.1 引言6.2 主流静态分析技术6.3 动态话题追踪误报成因分析6.4 误报检测6.5 实验与分析6.5.1 实验步骤6.5.2 实验结果及分析6.6 本章小结第7章 动态话题追踪中的时序权重7.1 研究基础7.2 时序权重及动态更新7.3 实验及分析7.3.1 时间距离阈值α7.3.2 权重阈值β7.3.3 时序权重有效性验证7.4 本章小结第8章 基于话题的事件相似度计算8.1 基础知识8.1.1 相关概念8.1.2 模板设计8.2 事件相似度计算8.3 同一话题下的事件相似度计算方法8.4 实验内容及分析8.5 本章小结第9章 总结与展望9.1 本书的主要工作9.2 对今后工作的展望
封面
书名:信息网络在话题识别与追踪中的应用研究
作者:吴树芳
页数:144
定价:¥58.0
出版社:科学出版社
出版日期:2017-03-01
ISBN:9787030518859
PDF电子书大小:142MB 高清扫描完整版