分类:大数据

最新 centos 7安装python3

最新 centos 7安装python3
CentOS7系统自带的Python版本是Python2.7,如需使用Python3.6,需要自行安装Python3.6。 CentOS7安装Python3.6有两种方式: 使用Yum源安装Python3.6 使用Python3.6源文件安装 推荐使用CentOS7 Yum源安装...

1227℃ 0评论 0喜欢

先验概率与后验概率、贝叶斯区别与联系

先验概率与后验概率、贝叶斯区别与联系
先验概率和后验概率 教科书上的解释总是太绕了。其实举个例子大家就明白这两个东西了。 假设我们出门堵车的可能因素有两个(就是假设而已,别当真):车辆太多和交通事故。 堵车的概率就是先验概率 。 那么如果我们出门之前我们听到新闻说今天路上出了个交通事故,那么我们想算一下堵车的概率,...

1003℃ 0评论 0喜欢

hadoop完全分布式搭建

hadoop完全分布式搭建
1:集群域名配置 /etc/hosts文件增加项目 vim /etc/hosts 192.168.93.201 master201 192.168.93.202 slave202 192.168.93.203 slave203 192.168.93.204 slave...

1182℃ 0评论 2喜欢

pig简介

pig简介
1.Pig 相比Java的MapReduce API,Pig为大型数据集的处理提供了更高层次的抽象,与MapReduce相比,Pig提供了更丰富的数据结构,一般都是多值和嵌套的数据结构。Pig还提供了一套更强大的数据变换操作,包括在MapReduce中被忽视的连接Join操作。...

1172℃ 0评论 0喜欢

Hive简介

Hive简介
1.Hive Hive是一个数据仓库技术,包括解释器、编译器、优化器,一次将一个sql语句装化为mapreduce代码,然后对代码进行编译,最后优化执行。实质是一个客户端程序,类似jsp和servlet的关系,实际上jsp也是被转化为servlet的的。hive运行时,元数据是...

1179℃ 0评论 0喜欢