数据清洗基础与实践
本书特色
[
数据的清洗是在大数据的挖掘与分析过程中的一个重要环节,由于数据类型的复杂性,采用传统的清洗脏数据的工作会辛苦和乏味。但是如果能利用好的清洗工具和适当的方法则可以让数据的清洗工作变得有趣并能达到事半功倍的效果。
本书从文件格式、数据类型、字符编码等基本概念入手,通过实例,探讨了如何提取和清洗关系型数据、网页数据,以及如何实现数据的转换与加载。每个知识点都附有案例供读者学习,通过实践让读者掌握所有的数据清洗技术。
如果您是一位数据科学家,或者从事数据科学工作,哪怕是一个对数据科学感兴趣的新手,那么很高兴本书适合您阅读。
]
内容简介
[
本书系统讲解了数据清洗的基础与理论, 分基础篇和实战篇两篇, 分别为: 数据清洗概述、数据格式类型与编码、电子表格与文本编辑器、基本技术与方法、数据抽取、数据的转换与加载、数据清洗工具介绍、基于Web的数据采集实战、基于RDBMS的数据清洗实战。
]
作者简介
[
生于1980年1月,讲师/项目监理师,硕士,重庆工程学院人工智能与大数据系教师,主要从事人工智能与医疗大数据的研究。自2015年以来主持商业医疗大数据项目3项,产值千万元以上。公开发表论文7篇(EI检索1篇)、主持、参与校级自然科学基金项目1项 、主持、参与建设校级重点课程1门 、主编、参与出版教材(教学讲义)3部
]
封面
书名:数据清洗基础与实践
作者:谢东亮,黄天春主编
页数:130页
定价:¥22.0
出版社:西安电子科技大学出版社
出版日期:2019-08-01
ISBN:9787560654607
PDF电子书大小:66MB 高清扫描完整版
本文标题:《数据清洗基础与实践》PDF下载
资源仅供学习参考,禁止用于商业用途,请在下载后24小时内删除!