在之前的博客《HDFS系列(5) |进行API操作前的准备》中,博主为大家分享的是在进行API操作前的准备工作。而本篇博客,博主为大家展现HDFS的API操作。 1. HDFS文件上传 1. 源码: package com.buwenbuhuo.hdfs; import org.apache.hadoop.co...
1. 了解HDFS Java API的基本使用方法 HDFS Java API提供了一系列类和方法,用于与HDFS进行交互。常用的类包括FileSystem、Path、FSDataOutputStream等。这些类提供了创建、读取、写入和删除文件的功能。 2. 编写Java代码以连接到HDFS 在编写代码之前,需要确保Hadoop环境已经正确配置,并且HDFS服务正在运行。然后,可以使用以...
1、上传文件到hdfs中 hadoop fs -put /本地文件 /aaa hadoop fs -copyFromLocal /本地文件 /hdfs路径 ## copyFromLocal等价于 put hadoop fs -moveFromLocal /本地文件 /hdfs路径 ## 跟copyFromLocal的区别是:从本地移动到hdfs中 2、下载文件到客户端本地磁盘 hadoop fs -get /hdfs中的路径 /本地磁盘目录...
使用FileSystem的deleteOnExit()方法,可以对HDFS文件系统中已经存在的文件进行删除。 遍历文件和目录 public static void listStatus(String path) throws Exception { Configuration conf = new Configuration(); conf.set("fs.default.name", "hdfs://centos01:9000"); FileSystem hdfs;= FileSystem.get(conf); ...
1.方法1:使用API直接上传 @Testpublicvoidupload1() { Configuration conf=newConfiguration(); conf.set("fs.defaultFS","hdfs://192.168.100.2:9000");//连接hdfstry{ FileSystem fileSystem=FileSystem.get(conf); fileSystem.copyFromLocalFile(newPath("d:\\jdk-8u221-linux-x64.tar.gz"),newPath("/...
1.方法1:使用API直接上传 @Testpublicvoidupload1() { Configuration conf=newConfiguration(); conf.set("fs.defaultFS","hdfs://192.168.100.2:9000");//连接hdfstry{ FileSystem fileSystem=FileSystem.get(conf); fileSystem.copyFromLocalFile(newPath("d:\\jdk-8u221-linux-x64.tar.gz"),newPath("/...
HDFS缓存元信息的内存默认大小1000MB,超过的部分会按照LRU原则写出到fsimage文件中。 2.使用Java API上传数据 下面通过Java程序来上传数据文件到HDFS上: package demo; import java.io.FileInputStream; import java.io.InputStream; import java.io.OutputStream; ...
3.上传文件到HDFS 初始化客户端对象后,接下来实现上传文件到HDFS的功能。由于采用Java测试类来实现JavaApi对HDFS的操作,因此可以在HDFS_CRUD.java文件中添加一个testAddFileToHdfs()方法来演示本地文件上传到HDFS的示例,具体代码如下:@Testpublic void testAddFileToHdfs() throws IOException { // 要上传的...
1:创建一个可以上传到hdfs文件系统的文件(wc.input) 2:编写java代码调用api完成附件的上传相当于执行-put命令 3:查看执行结果 全部代码 packagecom.lizh.hadoop.hdfs;importjava.io.File;importjava.io.FileInputStream;importjava.io.IOException;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop....
利用API写入文件 写入HDFS文件 (1)将数据直接写入HDFS文件 (2)将本地文件写入HDFS文件 写入HDFS文件 类似于HDFS Shell里的hdfs dfs -put命令 在net.zwh.hdfs包里创建WriteFileOnHDFS类 (1)将数据直接写入HDFS文件 在/ied01目录里创建hello.txt文件