数据为王

数据为王
关于大数据的那些事儿

Hbase

这家伙很懒,还没填写该栏目的介绍呢~

Hbase

Apache Phoenix for Cloudera CDH

阅读(782)评论(0)

Apache Phoenix is a relational database layer over HBase delivered as a client-embedded JDBC driver targeting low latency queries over HBase data. Apache Phoenix takes your SQ...

Hbase

MapReduce生成HFile入库到HBase

阅读(520)评论(0)

个人小站,正在持续整理中,欢迎访问:http://shitouer.cn小站博文地址:MapReduce生成HFile入库到HBase一、这种方式有很多的优点:1. 如果我们一次性入库hbase巨量数据,处理速度慢不说,还特别占用Region资源, 一个比较高效便捷的方法就是使用 “Bulk Loading”方法,即HBase提供的HFileOutputFo...

Hbase

HBase备份之导入导出

阅读(696)评论(0)

我们在上一篇文章《HBase复制》中讲述了如何建立主/从集群,实现数据的实时备份。但是,HBase复制只对设置好复制以后的数据生效,也即,配置好复制之后插入HBase主集群的数据才能同步复制到HBase从集群中,而对之前的历史数据,采用HBase复制这种办法是无能为力的。本文介绍如何使用HBase的导入导出功能来实现历史数据的备份。1)将HBase表数据导出...

Hbase

HBase 5种写入数据方式

阅读(469)评论(0)

Version :hadoop1.2.1; hbaes0.94.16;HBase写入数据方式(参考:《HBase The Definitive Guide》),可以简单分为下面几种:1. 直接使用HTable进行导入,代码如下:package hbase.curd; import java.io.IOException; import j...

Hbase

HBase Rowkey的散列与预分区设计

阅读(496)评论(0)

HBase中,表会被划分为1...n个Region,被托管在RegionServer中。Region二个重要的属性:StartKey与EndKey表示这个Region维护的rowKey范围,当我们要读/写数据时,如果rowKey落在某个start-end key范围内,那么就会定位到目标region并且读/写到相关的数据。简单地说,有那么一点点类似人群划分,...

Hbase

HBase快照(Snapshot)技术,hbasesnapshot

阅读(727)评论(0)

什么是快照快照就是一份元信息的合集,允许管理员恢复到表的先前状态。快照不是表的复制而是一个文件名称列表,因而不会复制数据。 完全快照恢复是指恢复到之前的“表结构”以及当时的数据,快照之后发生的数据不会恢复。快照的作用HBase中存在的备份或克隆表的方法就是使用复制/导出表或者在关闭表之后拷贝HDFS中的所有HFile。 复制或导出是通过一...

Hbase

HBase建立二级索引的一些解决方案

阅读(922)评论(0)

HBase建立二级索引的一些解决方案,hbase索引解决方案HBase的一级索引就是rowkey,我们只能通过rowkey进行检索。如果我们相对hbase里面列族的列列进行一些组合查询,就需要采用HBase的二级索引方案来进行多条件的查询。 常见的二级索引方案有以下几种: 1.MapReduce方案 2.ITHBASE方案&nb...

Hbase

浅析Trafodion体系结构

阅读(877)评论(0)

Trafodion简介Trafodion是一个构建在Hadoop/HBase基础之上的关系型数据库,它完全开源免费。Trafodion能够完整地支持ANSI SQL,并且提供ACID事务保证。和传统关系数据库不同的地方在于,Trafodion利用底层Hadoop的横向扩展能力,可以提供极高的扩展性。而传统数据库,比如MySQL,在数据量达到P级别的时候就很难...