![大数据技术入门(第2版)](https://wfqqreader-1252317822.image.myqcloud.com/cover/475/34752475/b_34752475.jpg)
上QQ阅读APP看书,第一时间看更新
2.9 AWS云平台上安装Hadoop
安装Hadoop的最简单的方法就是使用云平台(例如AWS)的Hadoop服务。EMR是AWS的Hadoop服务。下面阐述安装和配置EMR的步骤。从服务菜单中选择EMR,点击“create cluster”,如图2-27所示,填入集群名字,选择要安装的Hadoop的各个组件。我们选择了Hadoop和Spark。
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P67_3959.jpg?sign=1739208156-dUU1Acfou2ZSicJ9IdQou9naP2cwAIeS-0-e97260a89a48f4acc3ada5a6b2261653)
图2-27 创建Hadoop集群
如图2-28所示,指定Hadoop集群的硬件设置。
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P68_4004.jpg?sign=1739208156-EPTkNLpukd8SBw4NPICwdSHRbyvmrO9a-0-76510e41c35d95b1ec00ca97ace6decc)
图2-28 硬件配置
设置Hadoop集群的网络和安全设置。单击如图2-29所示的安全组的配置,就出现如图2-30所示的设置。然后,使用SSH登录到AWS的Master节点,就会出现如图2-31所示的界面,而后就可以输入Spark命令。
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P68_4005.jpg?sign=1739208156-reVAzpODawhMfUVt9QhZb1T5VXBBm3RB-0-0f4a6f274820c5007358c00eb8909781)
图2-29 网络和安全设置
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P68_4006.jpg?sign=1739208156-JXZPSSm4PSs2slOnT6lEbaqn2txm5l71-0-4e917931fe15188c7ab8ad504c3ab51d)
图2-30 安全组设置
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P68_4007.jpg?sign=1739208156-e4Mg4kb7VanZEtyxdJyxm5vQ8z8RqP1V-0-3af208f8270b8eed836efd0960518e97)
图2-31 Spark界面
除了使用SSH来操作Hadoop集群和Spark之外,还可以在如图2-32所示的界面中启动Zeppelin,随后就会出现如图2-33所示的界面。
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P69_4051.jpg?sign=1739208156-f2DZJIcr57x6WH8CdDhKv6w78Cn792V0-0-291068916af660c232391e6a51da8ceb)
图2-32 集群
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P69_4052.jpg?sign=1739208156-mFKniYm1qD7syeQkkZ0VWF9XUj5hwOuh-0-880683865d87ab6fc0b4d1904ec3f026)
图2-33 Zeppelin
之后,就可以输入Spark语句来操作集群上的数据(见图2-34,),查看日志信息(见图2-35)。
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P69_4053.jpg?sign=1739208156-Ub3uI5WTsMjG0jB2MXoMoGLs5S8cLKLL-0-84b8b6636fff627416f8fe931b9842be)
图2-34 Spark操作
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P69_4054.jpg?sign=1739208156-ashGEq5GK5PVkIAZYK8RXY21u39rCglm-0-f29d8cf7d5ecaabed6682b02eec212fc)
图2-35 查看日志