失效链接处理 |
Spark大数据处理_原理法与实?PDF 下蝲
转蝲自:(x)https://www.jb51.net/books/625805.html
本站整理下蝲Q?/strong>
版权归出版社和原作者所有,链接已删除,误买正?/b>
用户下蝲说明Q?/strong>
?sh)子版仅供预览,下蝲?4时内务必删除,支持正版Q喜Ƣ的误买正版书c:(x)
http://product.dangdang.com/24046879.html
相关截图Q?br />
![]() 资料介:(x) 本书以时下最为流行的Hadoop所存在的缺陷ؓ(f)出发点,深入出Cl了下一代大数据处理核心技术Spark的优势和必要性,q以最z的指引步骤展示了如何在10分钟内徏立一个Spark大数据处理环境。在此基上,本书以图文ƈ茂和丰富的示例代码讲解的形式pȝ性地揭示了Spark的运行原理、算子用、算法设计和优化手段Qؓ(f)读者提供了一个快速由入深掌握Spark基础能力和高U技巧的参考书c?本书共六章,涉及(qing)的主题主要包括大数据处理技术从Hadoop发展到Spark的必然性、快速体验Spark的指引、Spark架构和原理、RDD子使用Ҏ(gu)和示例、Spark法设计实例、SparkE序优化Ҏ(gu)?本书适合需要用Sparkq行大数据处理的E序员、架构师和品经理作为技术参考和培训资料Q亦可作为高校研I生和本U生教材?/span> 资料目录Q?/strong> W?章从Hadoop到Spark 1Q?Hadoop——大数据时代的火种 1Q?Q?大数据的由来 1Q?Q?Google解决大数据计问题的Ҏ(gu) 1Q?Q?Hadoop的由来与发展 1Q?Hadoop的局限?br style="margin: 0px; padding: 0px;" /> 1Q?Q?Hadoopq行机制 1Q?Q?Hadoop的性能问题 1Q?Q?针对Hadoop的改q?br style="margin: 0px; padding: 0px;" /> 1Q?大数据技术新?mdash;—Spark 1Q?Q?Spark的出C发展 1Q?Q?Spark协议?br style="margin: 0px; padding: 0px;" /> 1Q?Q?Spark的应用及(qing)优势 W?章体验Spark 2Q?安装和用Spark 2Q?Q?安装Spark 2Q?Q?了解Spark目录l构 2Q?Q?使用Spark Shell 2Q?~写和运行SparkE序 2Q?Q?安装Scala插g 2Q?Q?~写SparkE序 2Q?Q?q行SparkE序 2Q?Spark Web UI 2Q?Q?讉K实时Web UI 2Q?Q?从实时UI查看作业信息 W?章Spark原理 3Q?Spark工作原理 3Q?Spark架构?qing)运行机?br style="margin: 0px; padding: 0px;" /> 3Q?Q?Sparkpȝ架构与节点角?br style="margin: 0px; padding: 0px;" /> 3Q?Q?Spark作业执行q程 3Q?Q?应用初始?br style="margin: 0px; padding: 0px;" /> 3Q?Q?构徏RDD有向无环?br style="margin: 0px; padding: 0px;" /> 3Q?Q?RDD有向无环图拆?br style="margin: 0px; padding: 0px;" /> 3Q?Q?Task调度 3Q?Q?Task执行 W?章RDD子 4Q?创徏子 4Q?Q?Z集合cd数据创徏RDD 4Q?Q?Z外部数据创徏RDD 4Q?变换子 4Q?Q?对Value型RDDq行变换 4Q?Q?对Key/ Value型RDDq行变换 4.3行动子 4Q?Q?数据q算c行动算?br style="margin: 0px; padding: 0px;" /> 4Q?Q?存储型行动算?br style="margin: 0px; padding: 0px;" /> 4Q?~存子 W?章Spark法设计 5Q?qo(h) 5Q?去重计数 5Q?相关计数 5Q?相关pL 5Q?数据联结 5Q?TopK 5Q?Kmeans 5Q?兌规则挖掘 5Q?kNN 5Q?0朴素贝叶斯分c?br style="margin: 0px; padding: 0px;" /> W?章善用Spark 6Q?合理分配资源 6Q?控制q行?br style="margin: 0px; padding: 0px;" /> 6Q?利用持久?br style="margin: 0px; padding: 0px;" /> 6Q?选择恰当的算?br style="margin: 0px; padding: 0px;" /> 6Q?利用׃n变量 6Q?Q?累加器变?br style="margin: 0px; padding: 0px;" /> 6Q?Q?q播变量 6Q?利用序列化技?br style="margin: 0px; padding: 0px;" /> 6Q?x数据本地?br style="margin: 0px; padding: 0px;" /> 6Q?内存优化{略 6Q?集成外部工具 参考文?/span> |