零起点Python足彩大数据与机械学习实盘分析
本书特色
[
本书采用Python编程语言、Pandas数据分析模块、机器学习和人工智能算法,对足彩大数据进行实盘分析。设计并发布了开源大数据项目zc-dat足彩数据包,汇总了2010—2016年全球5万余场足球比赛的赛事和赔率数据,包括威廉希尔、澳门、立博、Bet365、Interwetten、SNAI、皇冠、易胜博、伟德、必发等各大赔率公司。介绍了如何使用Python语言抓取网页数据,下载更新zc-dat足彩数据包,并预测分析比赛获胜球队的取胜概率,同时提出了检测人工智能算法优劣的“足彩图灵”法则。
]
内容简介
[
采用MBA个案模式,配合Python教学代码,由浅入深,结合实盘案例,举一反三。无须专业编程基础,懂Excel即可开始学习。
]
作者简介
[
何海群,网名:字王,CHRD前海智库CTO,《中华大字库》发明人,出版书籍20余部,在人工智能、数据分析等方面具有20年一线专业经验;zwPython开发平台、zwQuant量化软件设计师,中国“Python创客”项目和“Python产业联盟”发起人,国内首个Python量化课程:《Python量化实盘·魔鬼训练营》创始人,极宽量化开源团队的创始人。1990年,发明国内第一个VR数据手套并获得专利授权,被业界称为“中国VR之父”;1992年,论文《人工智能与中文字型设计》入选《广东青年科学家文集》,现已成为中文字库行业三大基础建模理论之一;1997年,出版国内首部网络经济专著《网络商战》;2008年,在北京联合创办国内首家4A级网络公关公司,服务过200余家国际五百强企业,被公关协会誉为:中国网络公关事业的开创者与启蒙者;2012年,发布国内首个自主研发的智能中文字库设计软件《x2ttf涂鸦造字》,全功能全免费公益软件;2016年,推出国内首套纯python开源量化软件:zwQuant,以及国内首个Tick级别开源金融大数据项目:zwDat金融数据包。研究成果有:“小数据”理论,快数据模型,黑天鹅算法,GPU超算工作站、MTRD多节点超算集群算法、“1 N”网络传播模型、人工智能“足彩图灵法则”等。
]
目录
第1章 足彩与数据分析 11.1 “阿尔法狗”与足彩 11.2 案例1-1可怕的英国足球 31.3 关于足彩的几个误区 71.4 足彩 大事件 81.5 大数据图灵(足彩)原则 101.6 主要在线彩票资源 111.7 主要在线足彩数据源 151.8 足彩基础知识 171.9 学习路线图 18
第2章 开发环境 192.1 数据分析首选Python 192.1.1 大数据,why Python 192.1.2 入门简单,功能强大 212.1.3 难度降低90%,性能提高10倍 232.1.4 “零对象”编程模式 242.2 用户运行平台 252.3 程序目录结构 262.4 tfbDat足彩数据包 272.5 Spyder编辑器界面设置 282.5.1 开发环境界面设置 282.5.2 代码配色技巧 292.5.3 图像显示配置 312.5.4 重剑无锋 322.6 Notebook模式 342.7 模块库控制面板 362.7.1 模块库资源 372.7.2 模块库维护更新 372.7.3 系统关联 382.8 使用pip命令更新模块库 392.8.1 pip常用命令 392.8.2 进入Python命令行模式 412.8.3 pip安装模板 412.8.4 pip参数解释 422.8.5 pip-install参数选项 43
第3章 入门案例套餐 453.1 案例3-1 **次编程,hello,ziwang 453.1.1 简单调试 463.1.2 控制台复位 473.2 案例3-2 增强版hello,zwiang 473.3 案例3-3 列举系统模块库清单 493.4 案例3-4 常用绘图风格 503.5 案例3-5 Pandas常用绘图风格 523.6 案例3-6 常用颜色表cors 53
第4章 足彩量化分析系统 554.1 功能简介 554.1.1 目录结构 564.1.2 TFB安装与更新 564.2 TFB主体框架 574.2.1 模块构成 574.2.2 Top-Base极宽基础模块库 574.2.3 Top-Football极宽足彩专业模块库 584.2.4 tfbDat极宽足彩数据包 594.2.5 量化系统模块构成 604.2.6 案例4-1 赔率文件切割 614.2.7 案例4-2 批量切割数据文件 644.3 tfbDat数据结构 664.3.1 案例4-3 tfb数据格式 674.3.2 gid基本比赛数据格式 674.3.3 xdat赔率数据格式 694.4 足彩基本数据分析 734.4.1 案例4-4 比赛数据基本图表分析 734.4.2 案例4-5 比赛数据进阶图表分析 774.4.3 案例4-6 比赛数据年度图表分析 804.4.4 案例4-7 比赛数据时间细分图表分析 814.5 胜、平、负数据分析 884.5.1 案例4-8 胜、平、负数据分析 884.5.2 @修饰符 884.5.3 胜平负分析 904.6 赔率数据分析 914.6.1 案例4-9 赔率分析 914.6.2 扩充dr_gid_top10绘图函数 924.6.3 赔率对比 93
第5章 常用数据分析工具 965.1 Pandas数据分析软件 965.1.1 Python简介 965.1.2 案例5-1 Pandas常用统计功能 995.2 科学计算 1045.3 人工智能 1055.4 NLTK语义分析 1075.5 数据清洗统计分析 1095.6 数据可视化 109
第6章 辅助工具 1146.1 性能优化 1146.1.1 numexpr矢量加速库 1156.1.2 Numba支持GPU的加速模块库 1156.1.3 Blaze大数据优化模块库 1156.1.4 Pyston加速模块 1166.1.5 PyPy加速模块 1166.1.6 Cython 1166.1.7 其他优化技巧 1176.2 网页信息抓取 1176.2.1 Requests人性化的网络模块 1186.2.2 Scrapy网页爬虫框架 1186.2.3 Beautiful Soup 4 1196.3 其他工具模块 1206.3.1 Logging日志模块 1206.3.2 Debug调试工具 1216.3.3 re正则表达式 1216.3.4 并行编程 1226.4 网络辅助资源 1236.5 arrow优雅简洁的时间模块库 1256.5.1 案例2-2,arrow入门案例 1266.5.2 创建arrow时间对象 1286.5.3 创建时间戳 1286.5.4 arrow属性 1296.5.5 replace替换和shift位移 1306.5.6 format格式化参数 1306.5.7 时间转换 1316.5.8 短命令 1316.5.9 人性化 1316.5.10 范围和跨度 1326.5.11 工厂模式 1336.5.12 Tokens特殊字符 133
第7章 网络足彩数据抓取 1357.1 500彩票网站数据接口的优势 1357.1.1 案例7-1抓取赔率数据网页 1367.1.2 网页数据实战操作技巧 1397.2 网页解析的心灵鸡汤 1417.2.1 BS4四大要素三缺一 1427.2.2 Tag标签对象 1427.2.3 案例7-2 Tag标签对象 1427.2.4 案例7-3 Tag标签对象数据类型 1457.2.5 NavigableString导航字符串 1497.2.6 BeautifulSoup复合对象 1497.2.7 Comment注释对象 1507.2.8 案例7-4 bs4常用查找功能 1507.2.9 BS4节点遍历功能 1547.3 足彩基本数据抓取 1557.3.1 案例7-5 分析网页比赛数据 1557.3.2 案例7-6 提取网页比赛数据 1577.3.3 gid比赛基本数据结构 1597.3.4 案例7-7 提取比赛得分 1617.3.5 案例7-8 提取球队id编码 1647.3.6 案例7-9 抓取历年比赛数据 1677.3.7 案例7-10 流程图工具与Python 1717.3.8 实盘技巧 1727.3.9 案例7-11 进程池并发运行 1747.4 批量抓取足彩网页数据实盘教程 1777.4.1 案例7-12 批量抓取赔率数据 1777.4.2 fb_gid_getExt扩展网页下载函数 1787.4.3 bars节点数据包与pools彩票池 1787.4.4 抓取扩展网页 1807.5 足彩赔率数据抓取 1817.5.1 gid与赔率数据网页 1817.5.2 案例7-13 提取赔率数据 1847.5.3 赔率数据与结构化数据 1867.5.4 瀑布流数据网页与小数据理论 189
第8章 足彩数据回溯测试 1918.1 TFB系统构成 1928.1.1 TFB系统模块结构 1928.1.2 Top-Base通用基础模块库 1928.1.3 Top-Football极宽足彩专业模块库 1938.2 实盘数据更新 1948.2.1 案例8-1 实盘数据更新 1948.2.2 实盘要点:冗余 1958.2.3 实盘要点:耐心 1968.2.4 实盘要点:数据文件 1978.2.5 main_get函数 1978.3 变量初始化 1998.3.1 全局变量与类定义 2018.3.2 彩票池内存数据库 2028.3.3 内存数据库&数据包 2048.4 回溯测试 2058.4.1 案例8-3 回溯 2068.4.2 main_bt回溯主入口 2078.4.3 案例8-4 实盘回溯 2098.4.4 彩票池与统计池 2118.4.5 poolTrd下单交易数据 2128.4.6 poolRet回报记录数据 2138.4.7 实盘足彩推荐分析 2148.4.8 实盘回报分析 2148.4.9 全数据分析与足彩数据集 2158.5 bt_main回溯主函数 2168.5.1 bt_1dayMain单天回溯分析 2188.5.2 赔率数据合并函数 2198.5.3 单天回溯分析函数 2208.5.4 单日回报分析 2218.5.5 单场比赛分析 2238.6 sta01策略的大数据分析 2248.6.1 一号策略函数 2268.6.2 超过100%的盈利策略与秘诀 2278.6.3 统计分析 2288.6.4 回溯时间测试 2298.6.5 bt_main_ret总回报分析 230
第9章 参数智能寻优 2329.1 一元参数寻优 2339.1.1 一号策略参数寻优 2339.1.2 一元测试函数 2349.1.3 测试结果数据格式 2369.1.4 案例9-2 一元参数图表分析 2379.2 策略函数扩展 2419.2.1 扩展一号策略函数 2419.2.2 案例9-3 一号扩展策略 2429.2.3 案例9-4 sta10策略 2449.3 二元参数寻优 2469.3.1 案例9-5 sta10参数寻优 2469.3.2 案例9-6 二元参数图表分析 2489.4 策略310准多因子策略 2529.4.1 案例9-7 数据预处理 2549.4.2 案例9-8 策略310参数寻优 2579.4.3 案例9-9 策略310图表分析 2599.4.4 案例9-10 策略310 264
第10章 Python人工智能入门与实践 26610.1 从忘却开始入门 26610.2 Iris(爱丽丝) 26910.2.1 案例10-1:经典爱丽丝 27010.2.2 案例10-2:爱丽丝进化与矢量化文本 27210.3 AI标准流程 27310.3.1 机器学习与测试数据集合 27410.3.2 机器学习运行流程 27410.3.3 经典机器学习算法 27510.3.4 黑箱大法 27510.3.5 数据切割函数 27610.3.6 案例10-3:爱丽丝分解 27710.3.7 案例10-4:线性回归算法 281
第11章 机器学习经典算法案例(上) 28611.1 线性回归 28611.2 逻辑回归算法 29311.3 朴素贝叶斯算法 29611.4 KNN近邻算法 29911.5 随机森林算法 302
第12章 机器学习经典算法案例(下) 30812.1 决策树算法 30812.2 GBDT迭代决策树算法 31112.3 SVM向量机 31312.4 SVM-cross向量机交叉算法 31612.5 神经网络算法 31812.5.1 经典神经网络算法 31812.5.2 Sklearn神经网络算法 32012.5.3 人工智能学习路线图 32012.5.4 案例12-5:MLP神经网络算法 32112.5.5 案例12-6:MLP_reg神经网络回归算法 323
第13章 机器学习组合算法 32613.1 CCPP数据集 32613.1.1 案例13-1:CCPP数据集 32713.1.2 案例13-2CCPP数据切割 32813.1.3 数据切割函数 33013.1.4 案例13-3 读取CCPP数据集 33113.1.5 数据读取函数 33313.2 机器学习统一接口函数 33413.2.1 案例13-4 机器学习统一接口 33413.2.2 统一接口函数 33613.2.3 机器学习算法代码 33813.2.4 效果评估函数 33913.2.5 常用评测指标 34013.3 批量调用机器学习算法 34113.3.1 案例13-5 批量调用 34113.3.2 批量调用算法模型 34413.4 一体化调用 34513.4.1 案例13-6 一体化调用 34513.4.2 一体化调用函数 34613.5 模型预制与保存 34813.5.1 案例13-7 储存算法模型 34813.5.2 模型保存函数 35013.5.3 模型预测函数 35013.5.4 案例13-8批量储存算法模型 35113.5.5 批量模型储存函数
35313.5.6 案例13-9 批量加载算法模型 35313.6 机器学习组合算法 35713.6.1 案例13-10
机器学习组合算法 35713.6.2 机器学习组合算法函数 359
第14章 足彩机器学习模型构建 36114.1 数据整理 36114.1.1 案例14-1 赔率数据合成 36214.1.2 案例14-2 按年切割赔率数据 36514.1.3 案例14-3 累计切割赔率数据 36514.2 年度足彩赔率模型 36614.2.1 案例14-4
年度2016足彩赔率模型组 36714.2.2 案例14-5 年度多字段足彩赔率模型组 37014.3 累计足彩赔率模型
37314.3.1 案例14-6 累计2016足彩赔率模型组 37314.3.2 案例14-7 累计多字段足彩赔率模型组
37614.3.3 足彩算法模型文件 379
第15章 足彩机器学习模型验证 38115.1 年度赔率模型验证 38115.1.1
案例15-1 年度赔率模型验证 38115.1.2 案例15-2 多字段年度赔率模型验证 38315.2 累计赔率模型验证
38515.2.1 案例15-3 累计赔率模型验证 38515.2.2 案例15-4 多字段累计赔率模型验证 38615.3
年度组合模型验证 38815.3.1 案例15-5 年度组合模型验证 38815.3.2 案例15-6 多字段年度组合模型验证
39115.3.3 案例15-7 全字段年度组合模型验证 39115.3.4 测试数据对比分析 39215.4 累计组合模型验证
39315.4.1 案例15-8 年度组合模型验证 39315.4.2 案例15-9 多字段年度组合模型验证 39415.4.3
测试数据对比分析 394
第16章 结果数据分析 39716.1 神秘的df9 39716.1.1 案例16-1 调试模式
39716.1.2 神秘的df9 40016.2 盈利率分析 40216.2.1 案例16-2 盈利率计算 402
第17章
机器学习足彩实盘分析 40717.1 回溯主入口 40817.1.1 案例17-1 策略sta01 40917.1.2 结果文件解读
40917.1.3 数据字段分析 41117.2 机器学习与回溯分析 41217.2.1 案例17-2 log回归策略足彩分析
41417.2.2 log回归策略函数 41517.2.3 案例17-3 30天log回归策略足彩分析 41817.2.4 数据字段分析
42017.2.5 足彩推荐 42117.3 进一步深入 421
附录A Sklearn常用模块和函数 423
封面
书名:零起点Python足彩大数据与机械学习实盘分析
作者:何海群
页数:421
定价:¥99.0
出版社:电子工业出版社
出版日期:2017-05-01
ISBN:9787121310744
PDF电子书大小:84MB 高清扫描完整版
本文标题:《零起点Python足彩大数据与机械学习实盘分析》PDF下载
资源仅供学习参考,禁止用于商业用途,请在下载后24小时内删除!