数据挖掘与数据化运营实战-思路.方法.技巧与应用

节选

[

********资深数据分析专家卢辉撰写,多年数据挖掘应用实践的经验结晶
实战性强,从数据分析师的角度对商业实战进行了总结和归纳,以大量事实和案例展现了“以业务为核心,以思路为重点,以挖掘技术为辅佐”的数据挖掘商业实践

]

本书特色

[

  本书是目前有关数据挖掘在数据化运营实践领域比较全面和系统的著作,也是诸多数据挖掘书籍中为数不多的穿插大量真实的实践应用案例和场景的著作,更是创造性地针对数据化运营中不同分析挖掘课题类型,推出一一对应的分析思路集锦和相应的分析技巧集成,为读者提供“菜单化”实战锦囊的著作。作者结合自己数据化运营实践中大量的项目经验,用通俗易懂的“非技术”语言和大量活泼生动的案例,围绕数据分析挖掘中的思路、方法、技巧与应用,全方位整理、总结、分享,帮助读者深刻领会和掌握“以业务为核心,以思路为重点,以分析技术为辅佐”的数据挖掘实践应用宝典。

  全书共19章,分为三个部分:基础篇(第1~4章)系统介绍了数据分析挖掘和数据化运营的相关背景、数据化运营中“协调配合”的核心,以及实践中常见分析项目类型;实战篇(第6~13章)主要介绍实践中常见的分析挖掘技术的实用技巧,并对大量的实践案例进行了全程分享展示;思想意识篇(第5章,第14~19章)主要是有关数据分析师的责任、意识、思维的培养和提升的总结和探索,以及一些有效的项目质控制度和经典的方法论介绍。

]

内容简介

[

  特别推荐:
《数据分析:企业的贤内助》
 
     ********资深数据分析专家卢辉撰写,多年数据挖掘应用实践的经验结晶

  实战性强,从数据分析师的角度对商业实战进行了总结和归纳,以大量事实和案例展现了“以业务为核心,以思路为重点,以挖掘技术为辅佐”的数据挖掘商业实践

]

目录

目  录推荐序前言第1章 什么是数据化运营1.1 现代营销理论的发展历程1.1.1 从4p到4c1.1.2 从4c到3p3c1.2 数据化运营的主要内容 1.3 为什么要数据化运营1.4 数据化运营的必要条件 1.4.1 企业级海量数据存储的实现 1.4.2 精细化运营的需求 1.4.3 数据分析和数据挖掘技术的有效应用1.4.4 企业决策层的倡导与持续支持1.5 数据化运营的新现象与新发展1.6 关于互联网和电子商务的*新数据第2章 数据挖掘概述2.1 数据挖掘的发展历史2.2 统计分析与数据挖掘的主要区别2.3 数据挖掘的主要成熟技术以及在数据化运营中的主要应用2.3.1 决策树2.3.2 神经网络2.3.3 回归2.3.4 关联规则2.3.5 聚类2.3.6 贝叶斯分类方法2.3.7 支持向量机2.3.8 主成分分析2.3.9 假设检验2.4 互联网行业数据挖掘应用的特点第3章 数据化运营中常见的数据分析项目类型3.1 目标客户的特征分析3.2 目标客户的预测(响应、分类)模型3.3 运营群体的活跃度定义3.4 用户路径分析3.5 交叉销售模型3.6 信息质量模型3.7 服务保障模型3.8 用户(买家、卖家)分层模型3.9 卖家(买家)交易模型3.10 信用风险模型3.11 商品推荐模型3.11.1 商品推荐介绍3.11.2 关联规则3.11.3 协同过滤算法3.11.4 商品推荐模型总结3.12 数据产品3.13 决策支持第4章 数据化运营是跨专业、跨团队的协调与合作4.1 数据分析团队与业务团队的分工和定位4.1.1 提出业务分析需求并且能胜任基本的数据分析4.1.2 提供业务经验和参考建议4.1.3 策划和执行精细化运营方案4.1.4 跟踪运营效果、反馈和总结4.2 数据化运营是真正的多团队、多专业的协同作业4.3 实例示范数据化运营中的跨专业、跨团队协调合作第5章 分析师常见的错误观念和对治的管理策略5.1 轻视业务论5.2 技术万能论5.3 技术尖端论5.4 建模与应用两段论5.5 机器万能论5.6 幸福的家庭都是相似的,不幸的家庭各有各的不幸第6章 数据挖掘项目完整应用案例演示6.1 项目背景和业务分析需求的提出6.2 数据分析师参与需求讨论6.3 制定需求分析框架和分析计划6.4 抽取样本数据、熟悉数据、数据清洗和摸底6.5 按计划初步搭建挖掘模型6.6 与业务方讨论模型的初步结论,提出新的思路和模型优化方案6.7 按优化方案重新抽取样本并建模,提炼结论并验证模型6.8 完成分析报告和落地应用建议6.9 制定具体的落地应用方案和评估方案6.10 业务方实施落地应用方案并跟踪、评估效果6.11 落地应用方案在实际效果评估后,不断修正完善6.12 不同运营方案的评估、总结和反馈6.13 项目应用后的总结和反思第7章 数据挖掘建模的优化和限度7.1 数据挖掘模型的优化要遵循有效、适度的原则7.2 如何有效地优化模型7.2.1 从业务思路上优化7.2.2 从建模的技术思路上优化7.2.3 从建模的技术技巧上优化7.3 如何思考优化的限度7.4 模型效果评价的主要指标体系7.4.1 评价模型准确度和精度的系列指标7.4.2 roc曲线7.4.3 ks值7.4.4 lift值7.4.5 模型稳定性的评估第8章 常见的数据处理技巧8.1 数据的抽取要正确反映业务需求8.2 数据抽样8.3 分析数据的规模有哪些具体的要求8.4 如何处理缺失值和异常值8.4.1 缺失值的常见处理方法8.4.2 异常值的判断和处理8.5 数据转换8.5.1 生成衍生变量8.5.2 改善变量分布的转换8.5.3 分箱转换8.5.4 数据的标准化8.6 筛选有效的输入变量8.6.1 为什么要筛选有效的输入变量8.6.2 结合业务经验进行先行筛选8.6.3 用线性相关性指标进行初步筛选8.6.4 r平方8.6.5 卡方检验8.6.6 iv和woe8.6.7 部分建模算法自身的筛选功能8.6.8 降维的方法8.6.9 *后的准则8.7 共线性问题8.7.1 如何发现共线性8.7.2 如何处理共线性第9章 聚类分析的典型应用和技术小窍门9.1 聚类分析的典型应用场景9.2 主要聚类算法的分类9.2.1 划分方法9.2.2 层次方法9.2.3 基于密度的方法9.2.4 基于网格的方法9.3 聚类分析在实践应用中的重点注意事项9.3.1 如何处理数据噪声和异常值9.3.2 数据标准化9.3.3 聚类变量的少而精9.4 聚类分析的扩展应用9.4.1 聚类的核心指标与非聚类的业务指标相辅相成9.4.2 数据的探索和清理工具9.4.3 个性化推荐的应用9.5 聚类分析在实际应用中的优势和缺点9.6 聚类分析结果的评价体系和评价指标9.6.1 业务专家的评估9.6.2 聚类技术上的评价指标9.7 一个典型的聚类分析课题的案例分享9.7.1 案例背景9.7.2 基本的数据摸底9.7.3 基于用户样本的聚类分析的初步结论第10章 预测响应(分类)模型的典型应用和技术小窍门10.1 神经网络技术的实践应用和注意事项10.1.1 神经网络的原理和核心要素10.1.2 神经网络的应用优势10.1.3 神经网络技术的缺点和注意事项10.2 决策树技术的实践应用和注意事项10.2.1 决策树的原理和核心要素10.2.2 chaid算法10.2.3 cart算法10.2.4 id3算法10.2.5 决策树的应用优势10.2.6 决策树的缺点和注意事项10.3 逻辑回归技术的实践应用和注意事项10.3.1 逻辑回归的原理和核心要素10.3.2 回归中的变量筛选方法10.3.3 逻辑回归的应用优势10.3.4 逻辑回归应用中的注意事项10.4 多元线性回归技术的实践应用和注意事项10.4.1 线性回归的原理和核心要素10.4.2 线性回归的应用优势10.4.3 线性回归应用中的注意事项10.5 模型的过拟合及对策10.6 一个典型的预测响应模型的案例分享10.6.1 案例背景10.6.2 基本的数据摸底10.6.3 建模数据的抽取和清洗10.6.4 初步的相关性检验和共线性排查10.6.5 潜在自变量的分布转换10.6.6 自变量的筛选10.6.7 响应模型的搭建与优化10.6.8 冠军模型的确定和主要的分析结论10.6.9 基于模型和分析结论基础上的运营方案10.6.10 模型落地应用效果跟踪反馈第11章 用户特征分析的典型应用和技术小窍门11.1 用户特征分析所适用的典型业务场景11.1.1 寻找目标用户11.1.2 寻找运营的抓手11.1.3 用户群体细分的依据11.1.4 新品开发的线索和依据11.2 用户特征分析的典型分析思路和分析技术11.2.1 3种划分的区别11.2.2 rfm11.2.3 聚类技术的应用11.2.4 决策树技术的应用11.2.5 预测(响应)模型中的核心自变量11.2.6 假设检验的应用11.3 特征提炼后的评价体系11.4 用户特征分析与用户预测模型的区别和联系11.5 用户特征分析案例第12章 运营效果分析的典型应用和技术小窍门12.1 为什么要做运营效果分析12.2 统计技术在数据化运营中*重要*常见的应用12.2.1 为什么要进行假设检验12.2.2 假设检验的基本思想12.2.3 t检验概述12.2.4 两组独立样本t检验的假设和检验12.2.5 两组独立样本的非参数检验12.2.6 配对差值的t检验12.2.7 配对差值的非参数检验12.2.8 方差分析概述12.2.9 单因素方差分析12.2.10 多个样本组的非参数检验12.2.11 卡方检验12.2.12 控制变量的方法12.2.13 ab test第13章 漏斗模型和路径分析13.1 网络日志和布点13.1.1 日志布点13.1.2 日志采集13.1.3 日志解析13.1.4 日志分析13.2 漏斗模型与路径分析的主要区别和联系13.3 漏斗模型的主要应用场景13.3.1 运营过程的监控和运营效率的分析与改善13.3.2 用户关键路径分析13.3.3 产品优化13.4 路径分析的主要应用场景13.5 路径分析的主要算法13.5.1 社会网络分析方法13.5.2 基于序列的关联分析13.5.3 *朴素的遍历方法13.6 路径分析案例的分享13.6.1 案例背景13.6.2 主要的分析技术介绍13.6.3 分析所用的数据概况13.6.4 主要的数据结论和业务解说13.6.5 主要分析结论的落地应用跟踪第14章 数据分析师对业务团队数据分析能力的培养14.1 培养业务团队数据分析意识与能力的重要性14.2 数据分析师在业务团队数据分析意识能力培养中的作用14.3 数据分析师如何培养业务团队的数据分析意识和能力14.4 数据分析师培养业务团队数据分析意识能力的案例分享14.4.1  案例背景14.4.2 过程描述14.4.3 本项目的效果跟踪第15章 换位思考15.1 为什么要换位思考15.2 从业务方的角度换位思考数据分析与挖掘15.3 从同行的角度换位思考数据分析挖掘的经验教训第16章 养成数据分析师的品质和思维模式16.1 态度决定一切16.1.1 信念16.1.2 信心16.1.3 热情16.1.4 敬畏16.1.5 感恩16.2 商业意识是核心16.2.1 为什么商业意识是核心16.2.2 如何培养商业意识16.3 一个基本的方法论16.4 大胆假设,小心求证16.5 20/80原理16.6 结构化思维16.7 优秀的数据分析师既要客观,又要主观第17章 条条大道通罗马17.1 为什么会条条大道通罗马17.2 条条大道有侧重17.3 自觉服从和积极响应17.3.1 自觉服从17.3.2 积极响应17.4 具体示例第18章 数据挖掘实践的质量保障流程和制度18.1 一个有效的质量保障流程制度18.1.1 业务需求的收集18.1.2 评估小组评估需求的优先级18.1.3 课题组的成立及前期摸底18.1.4 向业务方提交正式课题(项目)计划书18.1.5 数据分析挖掘的课题展开18.1.6 向业务方提交结论报告及业务落地应用建议18.1.7 课题(项目)的落地应用和效果监控反馈18.2 质量保障流程制度的重要性18.3 如何支持与强化质量保障流程制度第19章 几个经典的数据挖掘方法论19.1 semma方法论19.1.1 数据取样19.1.2 数据探索19.1.3 数据调整19.1.4 模式化19.1.5 评价19.2 crisp-dm方法论19.2.1 业务理解19.2.2 数据理解19.2.3  数据准备19.2.4 模型搭建19.2.5 模型评估19.2.6 模型发布19.3 tom khabaza的挖掘9律

封面

数据挖掘与数据化运营实战-思路.方法.技巧与应用

书名:数据挖掘与数据化运营实战-思路.方法.技巧与应用

作者:卢辉

页数:258

定价:¥59.0

出版社:机械工业出版社

出版日期:2013-06-01

ISBN:9787111426509

PDF电子书大小:94MB 高清扫描完整版



本文标题:《数据挖掘与数据化运营实战-思路.方法.技巧与应用》PDF下载

资源仅供学习参考,禁止用于商业用途,请在下载后24小时内删除!