[HADOOP] HDFS에서 blockName의 파일을 찾는 방법 hadoop
HADOOPHDFS에서 blockName의 파일을 찾는 방법 hadoop
블록 이름 / ID가 주어진 HDFS에서 블록과 관련된 파일을 찾는 가장 쉬운 방법은 무엇입니까?
해결법
-
==============================
1.길고 고통스러운 방법은 모든 파일에 대한 읽기 권한이 있다고 가정하고 (디렉토리에 대해 실행) :
길고 고통스러운 방법은 모든 파일에 대한 읽기 권한이 있다고 가정하고 (디렉토리에 대해 실행) :
hadoop fsck / -files -blocks | grep blk_520275863902385418_1002 -B 20
그런 다음 블록 일치에서 이전 파일 이름으로 백업을 스캔합니다.
/hadoop/mapred/system/jobtracker.info 4 bytes, 1 block(s): OK 0. blk_520275863902385418_1002 len=4 repl=1
이 경우 blk_5202 ...는 /hadoop/mapred/system/jobtracker.info 파일의 일부입니다.
프로그래밍 방식으로 이들은 블럭 ID로 검색 할 수있는 이름 노드에 대한 인터페이스는 아니지만 2 차 이름 노드의 소스를 조사하여 편집을 통합하는 방법을 확인한 다음 2 차 이름 노드에서 저장된 출력을 실험 할 수 있습니다 이름 노드 (라이브 이름 노드 파일에서 작업하는 위험이 있음).
행운을 빕니다!
-
==============================
2.이것이 언제 소개되었을 지 확신하지 못했지만 이것을 할 수 있습니다.
이것이 언제 소개되었을 지 확신하지 못했지만 이것을 할 수 있습니다.
hdfs fsck -blockId <block_id> hdfs fsck -blockId blk_1100790203 Connecting to namenode FSCK started by hdfs Block Id: blk_1100790203 Block belongs to: /common/FFL1447685899336.txt
from https://stackoverflow.com/questions/10881449/how-to-find-file-from-blockname-in-hdfs-hadoop by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] hadoop을 사용한 이미지 처리 (0) | 2019.07.07 |
---|---|
[HADOOP] Hadoop Streaming에서 "typedbytes"또는 "rawbytes"를 사용하는 방법은 무엇입니까? (0) | 2019.07.07 |
[HADOOP] Avro 파일의 온보드 스키마를 사용하여 Spark에서 Avros를로드하려면 어떻게해야합니까? (0) | 2019.07.06 |
[HADOOP] java.util.Map의 드롭 인 대체품 찾기 (0) | 2019.07.06 |
[HADOOP] Apache Spark on YARN : 많은 수의 입력 데이터 파일 (스파크의 여러 입력 파일 결합) (0) | 2019.07.06 |