基于Python的智能文本分析
本书特色
[
预处理并将文本向量化成高维特征表示。·执行文档分类和主题建模。·通过可视化诊断指导模型选择过程。·提取关键短语、命名实体和图结构,实现文本数据推断。·建立对话框架,实现聊天机器人和语言驱动交互。·用Spark扩展处理能力,用神经网络实现对更复杂模型的支持。
]
内容简介
[
本书介绍了如何用Python实现健壮、可重复和可扩展的文本分析, 包括上下文特征和语言特征工程、向量化、分类、主题建模、实体解析、图分析和可视化操作。在本书的*后, 您将获得解决众多复杂现实问题的实用方法。
]
作者简介
[
Benjamin Bengfort是一位专门研究分布式系统、机器学习及其他相关技术的计算机科学家。Rebecca Bilbro是一名数据科学家和Python程序员,致力于研究机器学习工作流的可视化诊断。Tony Ojeda是District Data Labs的创始人和CEO,专注于商业策略应用分析、优化、预测服务,以及开源工具使用课程。陈光,北京邮电大学副教授,主要研究方向为机器学习和自然语言处理。
]
目录
目录前言 1第1章 语言与计算 13数据科学范式 14语言感知数据产品 .16语言即数据 21小结 .29第 2 章 构建自定义语料库 31语料库是什么? .32语料库数据管理 .35语料库读取器 39小结 .49第3章 语料库预处理与处置 50分解文档.50语料库的转换 60小结 .67第4章 文本向量化和转换流水线 68空间中的词 69Scikit-Learn API .81流水线 .88小结 .93第5章 面向文本分析的文本分类 95文本分类.96构建文本分类应用 .99小结 .110第6章 文本相似性聚类 . 112文本上的无监督学习 112文档相似性聚类 .114文档主题建模 127小结 .139第7章 上下文感知文本分析 140基于语法的特征提取 141n-Gram特征提取 147n-Gram语言模型 155小结 .165第8章 文本可视化 166可视化特征空间 .167模型诊断.185可视化操纵 193小结 .196第9章 文本的图分析 .198图计算与分析 200从文本中抽取图 .204实体解析.216小结 .221第10章 聊天机器人 223对话基础.224礼貌对话规则 231有趣的问题 239学习帮助.250小结 .257第11章 利用多处理和Spark扩展文本分析259Python多处理 .260Spark集群计算 271小结 .289第12章 深度学习与未来 .291应用神经网络 292神经网络语言模型 .292情感分析.303未来(几乎)已来 .309词汇表 311
封面
书名:基于Python的智能文本分析
作者:Benjamin Bengfort,Re
页数:318页
定价:¥88.0
出版社:中国电力出版社
出版日期:2020-01-01
ISBN:9787519838294
PDF电子书大小:78MB 高清扫描完整版
资源仅供学习参考,禁止用于商业用途,请在下载后24小时内删除!