亚洲精品国产高清在线观看,亚洲av成人无码精品电影在线,香港经典a毛片免费观看播放

大数据技术之Spark基础解析 PDF 下蝲

本站整理下蝲�Q?/strong>

链接�Q?a target="_blank">https://pan.baidu.com/s/1OOzVirXhR1e8wV3T3vMBfw

提取码：(x��)h38x

相关截图�Q?/strong>

主要内容�Q?/strong>

�W?1 �?Spark 概述 1.1什么是 Spark Spark 是一�U�快速、通用、可扩展的大数据分析引擎�Q?009 �q�诞生于加州大学伯克利分�?AMPLab�Q?010 �q�开源，2013 �q?6 月成�?Apache 孵化��目�Q?014 �q?2 月成�?Apache �� 目。项目是�?Scala �q�行�~�写�?1.2Spark 内置模块 Spark Core�Q�实��C�� Spark 的基本功能，包含��d��调度、内存管理、错误恢复、与存储 �pȝ��交互�{�模块。Spark Core 中还包含了对�Ҏ(gu��)��分布式数据�?Resilient Distributed DataSet�Q?��U?RDD)�?API 定义�?Spark SQL�Q�是Spark用来操作�l�构化数据的�E�序包。通过Spark SQL�Q�我们可以��?SQL 或�?Apache Hive 版本�?SQL 方言(HQL)来查询数据。Spark SQL 支持多种数据源，比如 Hive 表、Parquet 以及(qi��ng) JSON �{��?Spark Streaming�Q�是 Spark 提供的对实时数据�q�行��式计算的组件。提供了用来操作�?据流�?API�Q��ƈ且与 Spark Core 中的 RDD API 高度对应�?Spark MLlib�Q�提供常见的机器学习(f��n)(ML)功能的程序库。包括分�c�R��回归、聚�c�R��协�?�q��o(h��)�{�，�q�提供了模型评估、数�?导入�{�额外的支持功能�?/div>
集群��理器：(x��)Spark 设计为可以高效地在一个计��节点到数千个计��节点之间�׾~�计 ��。�ؓ(f��)了实现这��L(f��ng)��要求�Q�同时获得最大灵�z�L��，Spark 支持在各�U�集��管理器(Cluster Manager)上运行，包括 Hadoop YARN、Apache Mesos�Q�以�?Spark 自带的一个简易调�?器，叫作独立调度器�?Spark 得到了众多大数据公司的支持，�q�些公司包括 Hortonworks、IBM、Intel、Cloudera�?MapR、Pivotal、百度、阿里、腾讯、京东、携�E�、优酷土豆。当前百度的 Spark 已应用于大搜索、直辑֏�、百度大数据�{�业务；阉K��利用 GraphX 构徏了大规模的图计算和图挖掘�p?�l�，实现了很多生产系�l�的推荐��法�Q�腾�?Spark 集群辑ֈ� 8000 台的规模�Q�是当前已知�?世界上最大的 Spark 集群�?1.3 Spark 特点快与 Hadoop �?MapReduce 相比�Q�Spark ��Z��内存的运��要�?100 倍以上，��Z��?盘的�q�算也要�?10 倍以上。Spark 实现了高效的 DAG 执行引擎�Q�可以通过��Z�� 内存来高效处理数据流。计��的中间�l�果是存在于内存中的�?易用Spark 支持 Java、Python �?Scala �?API�Q�还支持��过 80 �U�高�U�算法，使用户可以快速构��Z��同的应用。而且 Spark 支持交互式的 Python �?Scala �?shell�Q�可�?非常方便地在�q�些 shell 中��?Spark 集群来验证解决问题的�Ҏ(gu��)��?通用Spark 提供了统一的解��x��案。Spark 可以用于批处理、交互式查询�Q�Spark SQL�Q��?实时��处理（Spark Streaming�Q�、机器学�?f��n)（Spark MLlib�Q�和图计��（GraphX�Q��?�q�些不同�c�d��的处理都可以在同一个应用中无缝使用。Spark �l�一的解��x��案非常具有吸引力�Q�毕竟�Q何公叔R��想用�l�一的��^台去处理遇到的问题，减少开发和 �l�护的�h力成本和部��v�q�_��的物力成本�?兼容�?/div>
Spark 可以非常方便��C��其他的开源��品进行融合。比如，Spark 可以使用 Hadoop �?YARN �?Apache Mesos 作�ؓ(f��)它的资源��理和调度器�Q�器�Q��ƈ且可以处理所�?Hadoop 支持的数据，包括 HDFS、HBase �?Cassandra �{�。这对于已经部��v Hadoop 集群的用��L(f��ng)��别重要，因�ؓ(f��)不需要做��M��数据�q�移��可以��?Spark 的强大处�?能力。Spark 也可以不依赖于第三方的资源管理和调度器，它实��C�� Standalone 作�ؓ(f��)其内�|�的资源��理和调度框�Ӟ��q�样�q�一步降低了 Spark 的��用门槛，使得所有�h都可以非常容易地部��v和��?Spark。此外，Spark �q�提供了�?EC2 上部 �|?Standalone �?Spark 集群的工兗��?�W?2 �?Spark �q�行模式 2.1 Spark 安装地址 1�Q�官�|�地址 http://spark.apache.org/ 2�Q�文��查看地址 https://spark.apache.org/docs/2.1.1/ 3�Q�下载地址 https://spark.apache.org/downloads.html 2.3 Local 模式 2.3.1 概述 Local 模式��是�q�行在一台计��机上的模式�Q�通常��是用于在本��Z��l�手和测试。它可以通过以下集中方式讄�� Master Local:所有计��都�q�行在一个线�E�当中，没有��M��q�行计算�Q�通常我们在本机执一些测试代码，或者练手，��q��q�种模式 Local[K]指定使用几个�U�程来运行计��，比如 local[4]��是�q�行 4 �?Worker �U�程。通常我们�?Cpu 有几�?Core�Q�就指定几个�U�程�Q�最大化利用 Cpu 的计��?能力Loca[*]�q�种模式直接帮你按照 Cpu 最�?Cores 来设�|�线�E�数了�?2.3.2 安装使用 1�Q�上传�ƈ解压 spark 安装�?[itstar@bigdata111 sorfware]$ tar -zxvf spark-2.1.1-bin-hadoop2.7.tgz -C /opt/module/ [itstar@bigdata111 module]$ mv spark-2.1.1-bin-hadoop2.7 spark

2�Q�官�Ҏ(gu��)�� PI 案例 [itstar@bigdata111 spark]$ bin/spark-submit \ --class org.apache.spark.examples.SparkPi \ --executor-memory 1G \ --total-executor-cores 2 \ ./examples/jars/spark-examples_2.11-2.1.1.jar \ 100 �Q?�Q�基本语�?bin/spark-submit \ --class <main-class> --master <master-url> \ --deploy-mode <deploy-mode> \ --conf <key>=<value> \ ... # other options <application-jar> \ [application-arguments] �Q?�Q�参数说明：(x��) --master 指定 Master 的地址�Q�默认�ؓ(f��) Local --class: 你的应用的启动类 (�?org.apache.spark.examples.SparkPi) --deploy-mode: 是否发布你的驱动�?worker 节点(cluster) 或者作��Z��个本地客��L(f��ng)�� (client) (default: client)* --conf: ��L��?Spark 配置属性，格式 key=value. 如果值包含空��|��可以加引�?“key=value” application-jar: 打包好的应用 jar,包含依赖. �q�个 URL 在集��中全局可见。比�?hdfs:// �׃�n存储�pȝ��Q?如果�?file:// path�Q?那么所有的节点�?path 都包含同��L(f��ng)�� jar application-arguments: 传给 main()�Ҏ(gu��)��的参�?--executor-memory 1G 指定每个 executor 可用内存�?1G --total-executor-cores 2 指定每个 executor 使用�?cup 核数�?2 �?3�Q�结果展�C?该算法是利用蒙特·卡罗��法�?PI

亚洲精品92内射,午夜福利院在线观看免费 ,亚洲av中文无码乱人伦在线视色,亚洲国产欧美国产综合在线,亚洲国产精品综合久久2007

最新Java全栈��׃��实战评��(免费)

springcloud分布式电(sh��)商秒杀实战评��

IDEA�怹��Ȁ�z?/h2>

66套java实战评��无套路领�?/h2>
锋哥开始收Java学员啦！

Python学习(f��n)路线�?/h2>

锋哥开始收Java学员啦！

Python学习(f��n)路线�?/h2>

大数据技术之Spark基础解析 PDF 下蝲

Java1234官方��?5�Q?/td>
Java1234官方��?5�Q?/td>	838462530