失效链接处理 |
《Spark快速数据处理》PDF 下蝲
转蝲自:(x)https://download.csdn.net/download/qq_34094572/10025701
下蝲地址Q?/strong>
版权归出版社和原作者所有,链接已删除,误买正?/b>
?sh)子版仅供预览?qing)学习(fn)交流使用Q下载后?4时内删除,支持正版Q喜Ƣ的误买正版书c:(x)《Spark快速数据处理?/a>
图书介:(x)
Spark是一个开源的通用q行分布式计框Ӟ由加州大学伯克利分校的AMP实验室开发,支持内存计算、多q代扚w处理、即席查询、流处理和图计算{多U范式。Spark内存计算框架适合各种q代法和交互式数据分析Q能够提升大数据处理的实时性和准确性,现已逐渐获得很多企业的支持,如阿里巴巴、百度、网易、英特尔{公司?/p> 本书pȝ讲解Spark的用方法,包括如何在多U机器上安装SparkQ如何配|一个Spark集群Q如何在交互模式下运行第一个Spark作业Q如何在Spark集群上构Z个生产的脱?独立作业Q如何与Spark集群建立q接和用SparkContextQ如何创建和保存RDDQ弹性分布式数据集)Q如何用Spark分布式处理数据,如何讄SharkQ将Hive查询集成C的Spark作业中来Q如何测试Spark作业Q以?qing)如何提升Sparkd的性能?/p>
相关截图Q?br />
![]()
图书目录Q?/strong>
译者序 作者简?/span> 前言 W?章 安装Spark以及(qing)构徏Spark集群 1.1 单机q行Spark 1.2 在EC2上运行Spark 1.3 在ElasticMapReduce上部|Spark 1.4 用Chef(opscode)部vSpark 1.5 在Mesos上部|Spark 1.6 在Yarn上部|Spark 1.7 通过SSH部v集群 1.8 链接和参?/span> 1.9 结 W?章 Sparkshell的?/span> 2.1 加蝲一个简单的text文g 2.2 用Sparkshellq行逻辑回归 2.3 交互式地从S3加蝲数据 2.4 结 W?章 构徏q运行Spark应用 3.1 用sbt构徏Spark作业 3.2 用Maven构徏Spark作业 3.3 用其他工h建Spark作业 3.4 结 W?章 创徏SparkContext 4.1 Scala 4.2 Java 4.3 Java和Scala׃n的API 4.4 Python 4.5 链接和参?/span> 4.6 结 W?章 加蝲与保存数?/span> 5.1 RDD 5.2 加蝲数据到RDD?/span> 5.3 保存数据 5.4 q接和参?/span> 5.5 结 W?章 操作RDD 6.1 用Scala和Java操作RDD 6.2 用Python操作RDD 6.3 链接和参?/span> 6.4 结 W?章 Shark-Hive和Spark的综合运?/span> 7.1 Z么用HiveShark 7.2 安装Shark 7.3 q行Shark 7.4 加蝲数据 7.5 在SparkE序中运行HiveQL查询 7.6 链接和参?/span> 7.7 结 W?章 试 8.1 用Java和Scala试 8.2 用Python试 8.3 链接和参?/span> 8.4 结 W?章 技巧和H门 9.1 日志位置 9.2 q发限制 9.3 内存使用与垃圑֛?/span> 9.4 序列?/span> 9.5 IDE集成环境 9.6 Spark与其他语a 9.7 安全提示 9.8 邮g列表 9.9 链接和参?/span> 9.10 结 |