基于Python的智能文本分析

本书特色

[

预处理并将文本向量化成高维特征表示。·执行文档分类和主题建模。·通过可视化诊断指导模型选择过程。·提取关键短语、命名实体和图结构,实现文本数据推断。·建立对话框架,实现聊天机器人和语言驱动交互。·用Spark扩展处理能力,用神经网络实现对更复杂模型的支持。

]

内容简介

[

本书介绍了如何用Python实现健壮、可重复和可扩展的文本分析, 包括上下文特征和语言特征工程、向量化、分类、主题建模、实体解析、图分析和可视化操作。在本书的*后, 您将获得解决众多复杂现实问题的实用方法。

]

作者简介

[

Benjamin Bengfort是一位专门研究分布式系统、机器学习及其他相关技术的计算机科学家。Rebecca Bilbro是一名数据科学家和Python程序员,致力于研究机器学习工作流的可视化诊断。Tony Ojeda是District Data Labs的创始人和CEO,专注于商业策略应用分析、优化、预测服务,以及开源工具使用课程。陈光,北京邮电大学副教授,主要研究方向为机器学习和自然语言处理。

]

目录

目录前言 1第1章 语言与计算 13数据科学范式 14语言感知数据产品 .16语言即数据 21小结 .29第 2 章 构建自定义语料库 31语料库是什么? .32语料库数据管理 .35语料库读取器 39小结 .49第3章 语料库预处理与处置 50分解文档.50语料库的转换 60小结 .67第4章 文本向量化和转换流水线 68空间中的词 69Scikit-Learn API .81流水线 .88小结 .93第5章 面向文本分析的文本分类 95文本分类.96构建文本分类应用 .99小结 .110第6章 文本相似性聚类 . 112文本上的无监督学习 112文档相似性聚类 .114文档主题建模 127小结 .139第7章 上下文感知文本分析 140基于语法的特征提取 141n-Gram特征提取 147n-Gram语言模型 155小结 .165第8章 文本可视化 166可视化特征空间 .167模型诊断.185可视化操纵 193小结 .196第9章 文本的图分析 .198图计算与分析 200从文本中抽取图 .204实体解析.216小结 .221第10章 聊天机器人 223对话基础.224礼貌对话规则 231有趣的问题 239学习帮助.250小结 .257第11章 利用多处理和Spark扩展文本分析259Python多处理 .260Spark集群计算 271小结 .289第12章 深度学习与未来 .291应用神经网络 292神经网络语言模型 .292情感分析.303未来(几乎)已来 .309词汇表 311

封面

基于Python的智能文本分析

书名:基于Python的智能文本分析

作者:Benjamin Bengfort,Re

页数:318页

定价:¥88.0

出版社:中国电力出版社

出版日期:2020-01-01

ISBN:9787519838294

PDF电子书大小:78MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注