[HADOOP] 하둡에서 XML 데이터의 시각화
HADOOP하둡에서 XML 데이터의 시각화
내 HDFS에서 나는 XML 처리를하고있을 것입니다. 즉, XML 파일을 처리하고 2 추출 nodes.And이 그래프 플롯 내 X 및 Y 것이다.
HDFS에서이 .Generating 그래프는 빠른을 사용하려면 output.I 내가 할 수있는 방법 miner.how 내가이 어떤 생각을 할 수있는 ...
그렇지 않으면
내 하둡 데이터를 시각화하는 방법이 있나요
해결법
-
==============================
1.HDFS가 작동하는 방법은 미리 정의 된 크기의 블록으로 파일을 분할하는 것입니다. 그냥 일을 좋아한다
HDFS가 작동하는 방법은 미리 정의 된 크기의 블록으로 파일을 분할하는 것입니다. 그냥 일을 좋아한다
split -b 64M file.xml
그리고 각 블록을 취하고 연고 데이터 노드에 저장합니다. 이제 HDFS는 64메가바이트의 블록 크기를 가지고 있으며, 파일 크기 1GB의 파일이 16 개 블록으로 분할하고 다른 위치에 저장됩니다 경우. 그래서 맵리 듀스 작업이 XML은 간단한 CSV 또는 TSV 파일과는 달리 구조이기 때문에 XML 파일 블록에서 이해 할 수 없습니다. 그래서 최대한 멀리 볼 수는 HDFS를 통해 XML 파일을 처리 할 수없는 경우 그것 HDFS 블록 크기보다 큰.
from https://stackoverflow.com/questions/15916491/visualization-of-xml-data-from-hadoop by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] 엑셀 2013 년 호튼 웍스 하이브 ODBC 연결 오류 (0) | 2019.10.05 |
---|---|
[HADOOP] 하이브 TEZ 감속기는 슈퍼 슬로우 실행 (0) | 2019.10.05 |
[HADOOP] MiniDFSCluster UnsatisfiedLinkError를 org.apache.hadoop.io.nativeio.NativeIO $ Windows.access0 (0) | 2019.10.05 |
[HADOOP] 행과 열 이름을 잃어버린없이 R에서 HDFS에서 파일을 읽는 방법 (0) | 2019.10.04 |
[HADOOP] 왜 우리는 원사에 mapred.job.tracker를 구성? (0) | 2019.10.04 |