superlxw1234

浏览: 542562 次
性别:
来自: 西安

博主相关

博客

微博

相册

留言

关于我

博客专栏

: Hive入门
浏览量：43273

文章分类

社区版块

存档分类

1. hadoop fs -dus 的源码： public static void dus(String src,Configuration conf) throws IOException { Path srcPath = new Path(src); FileSystem srcFs = srcPath.getFileSystem(conf); FileStatus status[] = srcFs.globStatus(new Path(src)); if (status==null || status.length==0) { ...

2012-05-07 17:10
浏览 8625
评论(0)
分类:互联网

hadoop本地windows测试mr程序

博客分类：

hadoop

@Override public int run(String[] args) throws Exception { //String fileName = "E:/tmp/1111.txt"; Configuration conf = new Configuration(); conf.set("fs.default.name", "file:///"); conf.set("mapred.job.tracker", "local"); String input ...

2012-05-04 17:28
浏览 1787
评论(0)
分类:互联网

求hadoop集群空间优化策略

博客分类：

hadoop

1. 加机器； 2. 减少备份数； 3. 压缩存储； 4. 删除一些没用的临时文件（目前删了hive失败任务对应的中间文件，不知道还有其他没？）除了上面的，不知道还有其他啥办法！！！

2012-04-28 17:51
浏览 1319
评论(1)
分类:互联网

复制本地文件到hdfs中的目标文件

博客分类：

hadoop

package com.lxw; import java.io.BufferedInputStream; import java.io.FileInputStream; import java.io.InputStream; import java.io.OutputStream; import java.net.URI; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.fs.Path; imp ...

2012-04-25 14:49
浏览 1934
评论(0)
分类:互联网

namenode启动时候都做了什么

博客分类：

hadoop

1. NameNode.main(): NameNode namenode = createNameNode(argv, null); 2. NameNode. createNameNode(): setStartupOption(conf, startOpt); // conf.set("dfs.namenode.startup", opt.toString()); NameNode namenode = new NameNode(conf); // initialize(conf); 3. initialize(conf); InetSock ...

2012-04-24 15:38
浏览 1532
评论(0)
分类:互联网

Hadoop利用Partitioner对输出文件分类

博客分类：

hadoop

需求描述： 1. 对文件1.txt中统计每个单词的个数(wordcount)$ cat 1.txt aa bb aa dd ff rr ee aa kk jj hh uu ii tt rr tt oo uu 2. 输出文件限定为两个，其中一个存放aa~kk之间的单词，另外一个存放ll~zz之间的单词解决方法： MR默认的reduce输出分区为HashParition public class HashPartitioner<K, V> extends Partitioner<K, V> ...

2012-04-23 15:32
浏览 2175
评论(0)
分类:互联网

cygwin中安装hadoop+eclipse编译源码并调试

博客分类：

hadoop

写在word中了 http://www.everbox.com/f/gxXMXa2dlzONxo5oipJElvqwLA

2012-04-20 17:01
浏览 1560
评论(0)
分类:互联网

Cygwin中运行hadoop mapreduce任务必须设置中间暂存目录

博客分类：

hadoop
java

cygwin上运行hadoop mr任务，一直报错： 2012-04-20 00:47:28,937 WARN org.apache.hadoop.mapred.TaskTracker: Error running child java.io.FileNotFoundException: File C:/home/Administrator/hadoop-0.20.2/hadooptmp/mapred/local/taskTracker/jobcache/job_201204200043_0002/attempt_201204200043_0002_m_000001_0/work ...

2012-04-20 01:22
浏览 2081
评论(0)
分类:互联网

使用java插入oracle中数据类型为clob的字段

博客分类：

java

表结构： SQL> desc liuxiaowen.hadoop_job_sql; Name Type Nullable Default Comments --------- ------------- -------- ------- -------- DATA_DESC VARCHAR2(20) Y JOBID VARCHAR2(100) Y SQL CLOB Y ...

2012-04-18 17:24
浏览 1761
评论(1)
分类:编程语言

使用java读取gz压缩的hdfs文件

博客分类：

hadoop

根据hdfs文件的后缀类型自动识别并解压： Path hdfsPath = new Path(args[0]); Configuration conf = new Configuration(); FileSystem fs = FileSystem.get(hdfsPath.toUri(),conf); CompressionCodecFactory factory = new CompressionCodecFactory(conf); CompressionCodec codec = factory.getCodec(hdfsPath); ...

2012-04-18 17:17
浏览 4818
评论(0)
分类:互联网

Hadoop启动脚本执行流程

博客分类：

hadoop

在bin/hadoop 这个脚本中，有如下片段： # figure out which class to run if [ "$COMMAND" = "namenode" ] ; then CLASS='org.apache.hadoop.hdfs.server.namenode.NameNode' HADOOP_OPTS="$HADOOP_OPTS $HADOOP_NAMENODE_OPTS" elif [ "$COMMAND" = "secondarynamenode& ...

2012-04-11 23:48
浏览 1834
评论(0)
分类:互联网

Hadoop集群安装笔记

博客分类：

hadoop

hadoop

1. 虚拟机链接方式：桥接 2. 修改linux主机名 /etc/sysconfig/network /etc/hosts 3. 修改linux ip ifconfig eth0 192.168.1.110 netmask 255.255.255.0 4. 三台机器上建立相同用户lxw 5. Ssh免密码登陆：用lxw用户 ...

2012-04-11 23:14
浏览 1325
评论(0)
分类:互联网

« 上一页 1 2 … 7 8 9 下一页 »

最近访客更多访客>>

博主相关

博客专栏

文章分类

社区版块

存档分类

最新评论

java api获取hdfs目录大小

hadoop本地windows测试mr程序

求hadoop集群空间优化策略

复制本地文件到hdfs中的目标文件

namenode启动时候都做了什么

Hadoop利用Partitioner对输出文件分类

cygwin中安装hadoop+eclipse编译源码并调试

Cygwin中运行hadoop mapreduce任务必须设置中间暂存目录

使用java插入oracle中数据类型为clob的字段

使用java读取gz压缩的hdfs文件

Hadoop启动脚本执行流程

Hadoop集群安装笔记

最近访客 更多访客>>

博主相关

博客专栏

文章分类

社区版块

存档分类

最新评论

最近访客更多访客>>