루프를 통해 hdfs 디렉토리

내 HDFS 디렉토리 구조는 다음과 같습니다.

/user/hive/warehouse/check.db/abcd/date=2015-02-02/xyz=hijk/000000_0 /user/hive/warehouse/check.db/abcd/date=2015-02-02/xyz=pqrs/000000_0

"/user/hive/warehouse/check.db/abcd"아래의 모든 디렉토리를 반복하고 2 개의 필드를 파생시키고 아래 코드를 사용하고 있습니다.

INPUT='/user/hive/warehouse/check.db/abcd'

for dir in $(hadoop fs -ls $INPUT/*/ | grep -o -e "$INPUT/.*") ; do

    xyz=$(echo $dir | cut -d '=' -f 3)
    date=$(echo $dir | sed 's/.*date=\(.*\)\/xyz.*/\1/g')

done

이 작업을 수행하는 가장 좋은 방법입니까 아니면이 작업을 수행 할 수있는 더 나은 대체 방법입니까?

해결법

==============================
1.물론 자바 코드 나 파이썬 스크립트를 사용할 수도 있습니다.

물론 자바 코드 나 파이썬 스크립트를 사용할 수도 있습니다.

from https://stackoverflow.com/questions/28685471/loop-through-hdfs-directories by cc-by-sa and MIT license

'HADOOP' 카테고리의 다른 글

[HADOOP] hadoop mapreduce / yarn에서 VCORES를 설정하는 방법은 무엇입니까? (0)	2019.06.17
[HADOOP] Hadoop Hive가 소스를 목적지로 이동할 수 없음 (0)	2019.06.17
[HADOOP] JDBC를 통한 Spark SQL과 Apache Drill 통합 (0)	2019.06.17
[HADOOP] Java를 사용하여 HDFS에서 파일 액세스 (0)	2019.06.17
[HADOOP] .txt / .csv 파일을 ORC 형식으로 변환하는 방법 (0)	2019.06.17

복붙노트

[HADOOP] 루프를 통해 hdfs 디렉토리

루프를 통해 hdfs 디렉토리

해결법

1.물론 자바 코드 나 파이썬 스크립트를 사용할 수도 있습니다.

'HADOOP' 카테고리의 다른 글

티스토리툴바