来源:http://www.cnblogs.com/freeweb/p/5390552.html 集群中时间不同步有可能会让大数据的应用程序运行混乱,造成不可预知的问题,比如Hbase,当时间差别过大时就会挂掉,所以在大数据集群中,ntp服务,应该作为一种基础的服务,以下在演示在CentOS 7.2集群上配置ntp服务的过程 首先检查系统中是否安装ntp包: rpm -q ntp 我这里是只是基础......

来源:http://mp.weixin.qq.com/s/iaR9_dBAGhmtSF062FOiKQ 在搭建Hadoop分布式集群之前,我们需要先准备好3台主机,分别安装好Linux系统,并完成Linux系统的网络配置和系统配置。相关资料:史上最全的Linux资料包,视频、电子书、PPT应有尽有。领取办法:关注“大数据研习社”后,微信后台回复“Linux”,即可获得私密下载链接。 大数据实战项目......

一.获取默认配置 在配置Hadoop的时候主要有三个配置文件core-site.xml,hdfs-site.xml,mapred-site.xml。默认都是空的,如何知道配置文件中都有哪些配置可以生效,有两个方法: 1.选择相应版本的hadoop,下载解压后,搜索*.xml,找到core-default.xml,hdfs-default.xml,mapred-default.xml,这些就是默认配......

一、安装环境 硬件:虚拟机 操作系统:Centos 6.4 64位 IP:192.168.241.128 主机名:admin 安装用户:root 二、安装JDK 安装JDK1.7或者以上版本。这里安装jdk1.7.0_79。 下载地址:http://www.oracle.com/technetwork/java/javase/downloads/index.html 1,下载jdk-7u79-Li......

从编程工具到可视化表现方式
数据可视化 / 2017-05-10

来源:http://fsux.me/     链接:http://suo.im/DVJUL    本文系转载。 说到可视化,就不得不说一下大数据,毕竟可视化是解决大数据的一种高效的手段,而如今人人都在谈论大数据,大数据 ≠ 有数据 ≠ 数据量大, 离谱的是,如今就连卖早点的觉得自己能统计每天卖出的种类,都敢说自己是搞大数据。 时间推移到 2009 年,“大数据” ...

探求ETL本质
大数据架构 / 2017-05-10

来源:36大数据  作者:山月艾草 ETL的考虑 做数据仓库系统,ETL是关键的一环。说大了,ETL是数据整合解决方案,说小了,就是倒数据的工具。回忆一下工作这么些年来,处理数据迁移、转换的工作倒还真的不少。但是那些工作基本上是一次性工作或者很小数据量,使用access、DTS或是自己编个小程序搞定。可是在数据仓库系统中,ET...

Hadoop没有消亡,它是大数据的未来
资讯 / 2017-05-04

来源:36大数据  作者: 数据之王 编辑: 覃里 文章链接:http://www.36dsj.com/archives/82100 【IT168 评论】人认为 Hadoop 正在失败,但硅谷数据管理公司 Hortonworks 的总经理 Vamsi K. Chemitiganti 并不这么看,为了反驳此前一篇文章《为什么 Hadoop 正在消亡?(Why Hadoop is Failing)》的......

Hadoop2.7安装
Hadoop / 2017-04-15

一、安装环境 硬件:虚拟机 操作系统:Centos 6.4 64位 IP:192.168.241.128 主机名:admin 安装用户:root 二、安装JDK 安装JDK1.7或者以上版本。这里安装jdk1.7.0_79。 下载地址:http://www.oracle.com/technetwork/java/javase/downloads/index.html 1,下载jdk-7u79-Li......