hive本地mr

superlxw1234

浏览: 542199 次
性别:
来自: 西安

最近访客更多访客>>

huageng520

rattersnake

yuanyuan7891

ticojj

博主相关

博客

微博

相册

留言

关于我

博客专栏

: Hive入门
浏览量：43173

文章分类

社区版块

存档分类

博客分类：

hive
hadoop

hive local mr

如果在hive中运行的sql本身数据量很小，那么使用本地mr的效率要比分布式的快很多。。

比如：

hive> select 1 from dual;
Total MapReduce jobs = 1
Launching Job 1 out of 1
Number of reduce tasks is set to 0 since there's no reduce operator
Starting Job = job_201208151631_2040444, Tracking URL = http://jt.dc.sh-wgq.sdo.com:50030/jobdetails.jsp?jobid=job_201208151631_2040444
Kill Command = /home/hdfs/hadoop-current/bin/hadoop job  -Dmapred.job.tracker=10.133.10.103:50020 -kill job_201208151631_2040444
2012-10-23 10:55:17,646 Stage-1 map = 0%,  reduce = 0%
2012-10-23 10:55:27,807 Stage-1 map = 100%,  reduce = 0%
Ended Job = job_201208151631_2040444
OK
1
Time taken: 17.853 seconds

set hive.exec.mode.local.auto=true; //开启本地mr

//设置local mr的最大输入数据量,当输入数据量小于这个值的时候会采用local mr的方式

set hive.exec.mode.local.auto.inputbytes.max=50000000;

//设置local mr的最大输入文件个数,当输入文件个数小于这个值的时候会采用local mr的方式

set hive.exec.mode.local.auto.tasks.max=10;

当这三个参数同时成立时候，才会采用本地mr

hive> select 1 from dual;             
Total MapReduce jobs = 1
Launching Job 1 out of 1
Number of reduce tasks is set to 0 since there's no reduce operator
Execution log at: /tmp/liuxiaowen/liuxiaowen_20121023105757_31c966be-ee79-4c23-a467-648290b338ac.log
Job running in-process (local Hadoop)
2012-10-23 10:58:03,728 null map = 100%,  reduce = 0%
Ended Job = job_local_0001
OK
1
Time taken: 4.842 seconds

更多大数据Hadoop、Spark、Hive的文章，请关注我的博客

2
顶

2
踩

分享到：

hive并行执行job | hive动态分区遇到的一个错误

2012-10-23 11:03
浏览 5474
评论(0)
分类:互联网
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

博客专栏

文章分类

社区版块

存档分类

最新评论

hive本地mr

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

博客专栏

文章分类

社区版块

存档分类

最新评论

hive本地mr

评论

发表评论

相关推荐

[一起学Hive]之十七-从Hive表中进行数据抽样-Sampling

[一起学Hive]之十六-Hive的WEB页面接口-HWI

[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics)

一起学Hive系列文章

MapReduce和Hive支持递归子目录作为输入

[一起学Hive]之十四-Hive的元数据表结构详解

[一起学Hive]之十三-Hive整合HBase，操作HBase表

[一起学Hive]之十二-Hive SQL的优化

[一起学Hive]之十一-Hive中Join的类型和用法

[一起学Hive]之十-Hive中Join的原理和机制

[一起学Hive]之九-Hive的查询语句SELECT

Spark1.4.0-SparkSQL与Hive整合-支持窗口分析函数

[一起学Hive]之八-使用Hive命令行

[一起学Hive]之六-Hive的动态分区

[一起学Hive]之七-向Hive表中加载数据

[一起学Hive]之五-Hive的视图和分区

[一起学Hive]之四-Hive的安装配置

[一起学Hive]之三—Hive中的数据库(Database)和表(Table)

[一起学Hive]之二—Hive函数大全-完整版

[一起学Hive]—Hive函数大全-part2

最近访客更多访客>>