[HADOOP] HDFS를 지운 후에도 여전히 사용 된 블록 풀을 표시하는 일부 데이터 노드
HADOOPHDFS를 지운 후에도 여전히 사용 된 블록 풀을 표시하는 일부 데이터 노드
하둡 버전 : 2.7.3 데이터 노드 : 32 블록 크기 : 512m 복제 : 3
명령을 사용하여 HDFS의 모든 데이터를 지 웠습니다. hdfs dfs -rm -r / *
HDFS 클러스터를 지운 후에도 블록이 0이지만 여전히 사용 된 블록 풀을 표시하는 데이터 노드는 거의 없습니다.
hdfs webui의 스크린 샷
hdfs fsck /의 출력은 다음과 같습니다
Connecting to namenode via http://ip-10-0-2-7:50070/fsck?ugi=ubuntu&path=%2F
FSCK started by ubuntu (auth:SIMPLE) from /10.0.2.7 for path / at Tue Jul 18 04:34:19 UTC 2017
Status: HEALTHY
Total size: 0 B
Total dirs: 1
Total files: 0
Total symlinks: 0
Total blocks (validated): 0
Minimally replicated blocks: 0
Over-replicated blocks: 0
Under-replicated blocks: 0
Mis-replicated blocks: 0
Default replication factor: 3
Average block replication: 0.0
Corrupt blocks: 0
Missing replicas: 0
Number of data-nodes: 32
Number of racks: 1
FSCK ended at Tue Jul 18 04:34:19 UTC 2017 in 1 milliseconds
The filesystem under path '/' is HEALTHY
블록 삭제가 비동기 프로세스라는 것을 알고 있지만 블록 풀 사용이 설정된 데이터 노드가 0으로 설정되지 않아 블록을 해제하는 데 많은 시간이 걸립니다. 아무도 내가 그 서버에서 왜 블록 삭제가 느린 지 또는 블록이 사용되는 다른 문제를 알아내는 데 도움을 줄 수 있습니까?
해결법
-
==============================
1.이에 대한 몇 가지 잠재적 인 원인이 있습니다.
이에 대한 몇 가지 잠재적 인 원인이 있습니다.
from https://stackoverflow.com/questions/45157724/some-datanodes-still-showing-block-pool-used-after-clearing-the-hdfs by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] Hive의 모든 테이블에서 특정 열 이름을 어떻게 찾을 수 있습니까? (0) | 2019.09.14 |
---|---|
[HADOOP] CDH에서 스파크 코어의 의존성 제외 (0) | 2019.09.14 |
[HADOOP] Spark에서 RDD의 복제 팩터를 변경하는 방법이 있습니까? (0) | 2019.09.14 |
[HADOOP] 하이브에서 Cluster By와 CLUSTERED BY의 차이점은 무엇입니까? (0) | 2019.09.14 |
[HADOOP] 메인 클래스 org.apache.nutch.crawl.InjectorJob을 찾거나로드 할 수 있음 (0) | 2019.09.14 |