失效链接处理 |
大数据学?fn)所需基本知识以及(qing)搭徏Hadoop大数据环境过E?PDF 下蝲
本站整理下蝲Q?/strong>
链接Q?a target="_blank">https://pan.baidu.com/s/1HaYn1EQJNv8U4C8VXYn_Ag
提取码:(x)5xku
相关截图Q?/strong>
![]()
主要内容Q?/strong>
W一阶段Q编E语a
大数据技术学?fn)前需要一定的Java技术作为基支持QJava只需理解一些基本的概念Q就可以用它~写出适合于各U情늚应用E序。在学习(fn)Java的时候,我们一般需要学?fn)这些课E:(x) HTML&CSS&JSQjava的基QJDBC与数据库QJSP java web技术, jQuery与AJAX技术,SpringMVC、Mybatis、Hibernate{等。这些课E都能帮助我们更好了(jin)解JavaQ学?x)运用Java?/div>
W二阶段Q大数据框架
学完?jin)编E语a之后Q一般就可以q行大数据部分的评学习(fn)?jin)。一般来_(d)学习(fn)大数据部分的旉比学?fn)Java的时间要短。大数据评Q包括大数据技术入门,量数据高分析语言Qv量数据存储分布式存储Q以?qing)v量数据分析分布式计算{部分,LinuxQHadoopQScala, HBase, Hive, Spark{等专业评。如果要完整的学?fn)大数据的话Q这些课E都是必不可的?/div>
学习(fn)大数据的头一步:(x)打好基础Q比高逼格的大数据技术更重要Q而基知识是Q编E语a和linux操作pȝ。我们以java~程ZQ当然了(jin)你所擅长的编E语a也可以是python、Scala{!
JavaQ只需要学?fn)Java的标准版JavaSE可以了(jin)Q像Servlet、JSP、Tomcat、Struts、Spring、HibernateQMybatis都是JavaEE方向的技术在大数据技术里用到的ƈ不多Q只需要了(jin)解就可以?jin),当然Java怎么q接数据库还是要知道的,像JDBC一定要掌握一下,有同学说Hibernate或Mybites也能q接数据库啊Qؓ(f)什么不学习(fn)一下,我这里不是说学这些不好,而是说学q些可能?x)用你很多时_(d)工作中也不常用,我还没看到谁做大数据处理用到q两个东西的Q当然你的精力很充的话Q可以学学Hibernate或Mybites的原理,不要只学APIQ这样可以增加你对Java操作数据库的理解Q因两个技术的核心(j)?yu)是Java的反加上JDBC的各U用?/div>
LinuxQ因为大数据相关软g都是在Linux上运行的Q所以Linux要学?fn)的扎实一些,学好Linux对你快速掌握大数据相关技术会(x)有很大的帮助Q能让你更好的理解hadoop、hive、hbase、spark{大数据软g的运行环境和|络环境配置Q能踩很多坑,学会(x)shellp看懂脚本q样能更Ҏ(gu)理解和配|大数据集群。还能让你对以后新出的大数据技术学?fn)v来更快?/div>
接下来就是大数据技术的两大生态系l:(x)Hadoop生态系l和spark生态系l?/div>
HadoopQ这是现在流行的大数据处理^台几乎已l成为大数据的代名词Q所以这个是必学的。Hadoop里面包括几个lgHDFS、MapReduce和YARNQHDFS是存储数据的地方像我们?sh)脑的硬盘一h仉存储在这个上面,MapReduce是对数据q行处理计算的,它有个特点就是不多大的数据只要l它旉它就能把数据跑完Q但是时间可能不是很快所以它叫数据的批处理。YARN是体现Hadoopq_概念的重要组件有?jin)它大数据生态体pȝ其它软gp在hadoop上运行了(jin)Q这样就能更好的利用HDFS大存储的优势和节省更多的资源比如我们׃用再单独Z个spark的集了(jin)Q让它直接跑在现有的hadoop yarn上面可以了(jin)?/div>
SparkQ它是用来I补基于MapReduce处理数据速度上的~点Q它的特Ҏ(gu)把数据装载到内存中计而不是去L的要死进化还特别慢的盘。特别适合做P代运,所以算法流们特别稀饭它。它是用scala~写的。Java语言或者Scala都可以操作它Q因为它们都是用JVM的?/div>
以上很多都是必须的理论技术知识,惌成功׃Q光U怸谈兵不行Q还需要一定的实战l验才行Q寻找一些大数据相关的项目进行练l手QmZ下自q技术?/div>
以上是对如何学?fn)大数据的简单ȝQ如果学完之后仍有余力,自然也是可以学习(fn)机器学习(fn)、h工智能等技术知识吗Q对你以后的׃?x)有很大的优势?/div>
W二:(x)大数据环?/div>
一、Linux基础环境?qing)系l模板制?Q?019.10.15Q?nbsp;
1.1安装pȝQLinux Centos 6.10 Minimal ?/div>
1.2|络配置Q?/div>
1) cd /etc/sysconfig/network-scripts/
2) ls 查看文g目录
3) vi ifcfg-eth0 用来修改|卡配置参数
4Qvi刚打开是编辑控制模式,输入iQ进入insert模式
5Q注释硬件mac地址Q语句前?Q主要用于虚拟环境,克隆虚拟Z保证mac的唯一性?/div>
6Q删除UUID?/div>
7QONBOOT=no (Ҏ(gu)yesQ默认网卡是用状态,修改之后为启用状??/div>
8QBOOTPROTO=DHCP (此处应修改ؓ(f)?rn)态IP )如下Q打开VM虚拟|络~辑器查看相关信息?/div>
BOOTPROTO=static
IPADDR=192.168.28.8
NETMASK=255.255.255.0
GATEWAY=192.168.28.2
DNS1=114.114.114.114
9Q按ESCQshift+Q?输入wq (写入盘q出)(j)
10Q重启网l服?service network restart
11) 输入ifconfig 查看|络配置参数是否正确
12Q通过ping 命o(h)试|络是否OK
1.3关闭防火?/div>
1Qservice iptables stop (临时关闭防火? ?/div>
2Qchkconfig iptables off (用防火? ?nbsp;
1Qcd /etc/selinux ,输入pwd,输入 ll查看文g列表?/div>
2Qvi config 修改配置文g SELINUX修改?disabled?/div>
注意保存退出用wqQ如果下意识的按Ctrl+S?x)锁住vi~辑Q将不能输入M字符Q可以用Ctrl+Q来解冻)(j)?/div>
1.4 修改L名和域名的关p?/div>
1Q?vi /etc/hosts 增加如下Q?/div>
192.168.28.11 node01
192.168.28.12 node02
192.168.28.13 node03
192.168.28.14 node04
2)保存退?/div>
1.5 删除另外一ơ的g|络地址Q次步骤也是只在虚拟环境下做Q?/div>
1Q进?cd /etc/udev/rules.d/
2Q列表显Cll
3) 通过 cat 70-persistent-net.rules 查看其内容(记录?jin)Mac地址信息Q?/div>
4Qrm -f 70-persistent-net.rules 删除q个文g
1.6 poweroff x。关机后在VM下拍快照Q保存状态信息?/div>
二、克隆出四台服务?br />
|