互联网信息监测系统研究

本书特色

[

互联网是现代社会信息发布、交换和获取的重要渠道,各类对企业发展有重大影响的信息,也大量通过互联网发布、交换和获取。对互联网上的上述信息进行检测和分析,及时发现与企业相关的重要新闻或敏感事件,并连接到企业接口人的业务工作中,进而形成面向互联网的服务支撑业务体系。 互联网服务支撑信息监测系统的是一整套完整严密的软硬件系统,它需要从每秒都有海量新增内容的互联网上,扫描目标媒体站点,并综合采纳搜索引擎的实时搜索结果,将获取到的原始网页信息,解析并转化为结构化文档,并执行转载统计、热点统计、预警、聚类、分类等文档挖掘算法,从而在此基础上为用户提供有价值的、有针对性的咨询分析,并支持用户在web界面上执行流程规范的编辑、批阅、分析、预警。

]

作者简介

[

周辉,1980年生,海南海口人,2002年于中国科学技术大学计算机科学技术系获得学士学位,2008年于中国科学院软件研究所获得博士学位。主要研究方向:计算机网络、海量数据处理、数字旅游。 近年来参与多项国家和省级的信息网络相关项目,以**作者身份发表论文15篇,曾荣获ICCNMC 2005大会的**论文奖,微软亚洲研究院颁发的“微软学者”奖,以及中国科学院的院长奖。

]

目录

**章 引言1.1互联网信息1.2互联网信息监测1.3手工监测的不足1.4互联网信息监测系统1.5全文组织结构第二章 常见企业用户需求2.1 业务功能需求2.2 非功能性需求第三章 系统设计3.1 系统结构3.2 分布式网络信息采集子系统3.3 海量信息管理与检索子系统3.4 多维分析与机器学习子系统3.5 权限与接口管理子系统3.6 交互子系统3.7 系统部署方案第四章 数据处理流程4.1 结构化解析4.2 多语言支持4.3 网页正文提取4.4 网页信息抽取4.5 命名实体识别4.6 数据规模估算第五章 关键技术解析5.1 文本聚类5.2 文本分类5.3 高可用ha5.4 全文检索5.5数据模型nosql5.6词语统计与分析5.7元搜索5.8网络协议robots第六章 相关厂商和产品6.1 中科新天6.2 谷尼国际6.3 方正智思6.4 北京本果6.5 维思比6.6 乐思软件6.7 中科点击第七章 相关开源软件7.1全文索引框架 apache lucene7.2搜索引擎 apache nutch7.3全文检索平台 apache solr7.4分布式计算基础平台 apache hadoop7.5应用服务器 apache tomcat7.6数据库服务器 mysql7.7中文分词工具 ikanalyzer7.8消息中间件apache activemq第八章 总结

封面

互联网信息监测系统研究

书名:互联网信息监测系统研究

作者:周辉

页数:97

定价:¥22.0

出版社:知识产权出版社

出版日期:2015-09-01

ISBN:9787513022545

PDF电子书大小:36MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注