失效链接处理 |
R语言 PDF 下蝲
本站整理下蝲Q?/strong>
版权归出版社和原作者所有,链接已删除,误买正?/b>
用户下蝲说明Q?/strong>
?sh)子版仅供预览,下蝲?4时内务必删除,支持正版Q喜Ƣ的误买正版书c:
http://product.dangdang.com/673231958.html
相关截图Q?/strong>
![]() 资料介: q年来,R语言可谓是数据分析的热门语言Q相关的资料五花八门Q让读者难以抉择。本书力求用z、精l,以理Z实践相结合的方式让大家快速掌握R语言?/span> 全书?4章,W?章ؓl论Q从数学、统计学和逻辑?个方面探讨了树立正确数据思维的一些原则;其余各章分ؓ基础(W??0章)、应用篇Q第11?2章)和进阶篇Q第13?4章)。基按照数据分析过E,主要讨论了R的数据结构、数据导?导出、数据清z、数据变换、可视化、高U语a~程和常用徏模方法。应用篇通过?个经典案例的分析Q读者能够把学到的R基础知识应用到解军_际问题,把数据变成h(hun)倹{进阶篇解决如何用R处理大数据的一些技术?/span> 本书可用作培d用型人才的课E教材,也可作ؓ数据分析爱好者的参考资料?/span> 资料目录Q?/strong> W??l论 1.1 Z么学习R语言 1 1.1.1 R是什?1 1.1.2 R语言主要优势 2 1.2 正确的数据思维?4 1.2.1 数学思维 5 1.2.2 l计思维 5 1.2.3 逻辑思维 10 习题 12 基础?/span> W??R语言入门 2.1 新手上\ 17 2.1.1 两个例子 17 2.1.2 R是什?19 2.2 R语言开发环境部|?19 2.2.1 安装R 19 2.2.2 安装RStudio 20 2.3 获取帮助 22 2.3.1 文档和搜?22 2.3.2 演示 22 2.3.3 帮助函数 23 2.4 工作I间 23 2.5 脚本 24 2.6 R?25 习题 25 W??数据cd 3.1 变量与常?27 3.1.1 变量 27 3.1.2 帔R 28 3.2 l构cd 28 3.2.1 向量 29 3.2.2 矩阵 31 3.2.3 数组 33 3.2.4 数据?35 3.2.5 因子 36 3.2.6 列表 37 3.3 字符串操?38 3.3.1 基本操作 38 3.3.2 字符串处理stringr?39 3.4 用于数据处理和{换的常用函数 40 习题 41 W??数据准备 4.1 数据导入 43 4.1.1 键盘输入数据 44 4.1.2 导入文本文g 45 4.1.3 导入Excel数据 46 4.1.4 导入数据库文?47 4.2 数据导出 48 4.2.1 导出文本文g 48 4.2.2 保存囄 49 习题 49 W??数据可视?/span> 5.1 低水q绘囑֑?51 5.1.1 ?51 5.1.2 U?54 5.1.3 ?56 5.2 高水q绘囑֑?59 5.2.1 认识ggplot2 59 5.2.2 几何对象 59 5.2.3 映射 60 5.2.4 l计对象 62 5.2.5 标度 63 5.2.6 分面 65 5.2.7 其他修饰 67 5.3 交互式绘囑֑?69 5.3.1 rCharts?69 5.3.2 plotly?70 5.3.3 shiny 72 习题 80 W??数据探烦 6.1 ~失值分?82 6.1.1 与缺失值相关的几个概念 82 6.1.2 ~失值检?83 6.2 异常值分?84 6.2.1 q图检验离点 85 6.2.2 散点图检离点 86 6.2.3 LOFҎ(gu)异常?87 6.2.4 聚类Ҏ(gu)异常?87 6.3 不一致值分?88 6.4 数据的统计特征分?88 6.4.1 分布分析 88 6.4.2 Ҏ(gu)分析 90 6.4.3 l计量分?91 6.4.4 周期性分?93 6.4.5 相关性分?94 习题 97 W??数据变换 7.1 数据清洗 100 7.1.1 ~失数据处理 100 7.1.2 数据去重 101 7.1.3 规范?102 7.2 数据选择 103 7.2.1 删除?5%以上相同数值的自变?103 7.2.2 删除高相x的自变?104 7.2.3 重要变量的选择 105 7.2.4 数据集选择 106 7.2.5 L分分?106 7.2.6 因子分析 108 7.3 数据集成 109 7.3.1 通过向量化重构数?109 7.3.2 为数据添加新变量 110 7.3.3 数据透视?112 7.3.4 频度 117 7.3.5 数据整合 118 7.3.6 分组汇?121 习题 124 W??高~程 8.1 控制l构 126 8.1.1 选择l构E序设计 126 8.1.2 循环l构E序设计 127 8.2 用户自定义函?128 习题 129 W??数据建模 9.1 Rattle?132 9.2 聚类模型 139 9.2.1 背景 139 9.2.2 K-Means聚类 139 9.2.3 Ewkm聚类 142 9.2.4 层次聚类QHierachicalQ?144 9.2.5 双向聚类QBiClusterQ?146 9.3 兌分析模型 147 9.3.1 背景 147 9.3.2 基本术语 148 9.3.3 兌规则的分c?149 9.3.4 Apriori法 150 9.3.5 实验指导 151 9.4 传统决策树模?153 9.4.1 背景 153 9.4.2 ID3法 155 9.4.3 C4.5法 156 9.4.4 实验指导 156 9.5 随机林决策树模?159 9.5.1 背景 159 9.5.2 随机林法 159 9.5.3 实验指导 161 9.6 自适应选择决策树模?164 9.6.1 背景 164 9.6.2 Boosting法 164 9.6.3 adaboost法 165 9.6.4 实验指导 165 9.7 SVM 169 9.7.1 背景 169 9.7.2 SVM法 169 9.7.3 实验指导 172 9.8 U性回归模?173 9.8.1 背景 173 9.8.2 一元线性回归方?173 9.8.3 实验指导 175 9.9 经|络模型 175 9.9.1 背景 175 9.9.2 人工经|络模型 176 9.9.3 实验指导 179 习题 181 W?0?模型评估 10.1 数据?185 10.2 h矩阵 186 10.2.1 二分cL淆矩?186 10.2.2 模型评h(hun)指标 187 10.2.3 多分cL淆矩?188 10.3 风险?188 10.3.1 风险囄作用 188 10.3.2 实验指导 189 10.4 ROC曲线 191 10.4.1 什么是ROC曲线 191 10.4.2 ROC曲线作用 191 10.4.3 实验指导 191 习题 193 应用?/span> W?1?影响大学q_录取分数U因素分?/span> 11.1 背景与目?197 11.2 数据说明 197 11.3 描述性分?200 11.4 ȝ与徏?203 W?2?收视率分?/span> 12.1 背景介绍 204 12.2 数据说明 204 12.3 描述性分?205 12.4 ȝ与徏?211 q阶?/span> W?3?RHadoop 13.1 认识RHadoop 215 13.1.1 Z么要让Hadoopl合R语言 215 13.1.2 Mahout与R在做数据挖掘的区?216 13.2 RHadoop安装 216 13.2.1 依赖包安?216 13.2.2 RHadoop的特?219 13.3 l合l习 220 习题 225 W?4?SparkR 14.1 认识SparkR 228 14.1.1 安装SparkR 228 14.1.2 在R或Rstudio中调用SparkR 228 14.2 SparkDataFrame 229 14.3 SparkR支持的机器学习算?230 14.4 l合l习 230 14.4.1 加蝲数据 230 14.4.2 SparkDataFrame基本操作 231 14.4.3 从Spark上运行SQL查询 233 14.4.4 SparkR操作hdfs上的文g 233 14.4.5 通过SparkR操作spark-sql以hive的表为对?234 习题 234 参考文?/span> 附录 大数据和人工实验环境 |