分类:hadoop

hadoop完全分布式搭建

hadoop完全分布式搭建
1:集群域名配置 /etc/hosts文件增加项目 vim /etc/hosts 192.168.93.201 master201 192.168.93.202 slave202 192.168.93.203 slave203 192.168.93.204 slave...

1189℃ 0评论 2喜欢

pig简介

pig简介
1.Pig 相比Java的MapReduce API,Pig为大型数据集的处理提供了更高层次的抽象,与MapReduce相比,Pig提供了更丰富的数据结构,一般都是多值和嵌套的数据结构。Pig还提供了一套更强大的数据变换操作,包括在MapReduce中被忽视的连接Join操作。...

1178℃ 0评论 0喜欢

Hive简介

Hive简介
1.Hive Hive是一个数据仓库技术,包括解释器、编译器、优化器,一次将一个sql语句装化为mapreduce代码,然后对代码进行编译,最后优化执行。实质是一个客户端程序,类似jsp和servlet的关系,实际上jsp也是被转化为servlet的的。hive运行时,元数据是...

1185℃ 0评论 0喜欢

什么是Zookeeper ?

什么是Zookeeper ?
什么是Zookeeper,Zookeeper的作用是什么,它与NameNode及HMaster如何协作? 一、什么是Zookeeper ZooKeeper 顾名思义 动物园管理员,他是拿来管大象(Hadoop) 、 蜜蜂(Hive) 、 小猪(Pig)  的管理员, Apac...

1136℃ 0评论 0喜欢