복붙노트

[HADOOP] 하둡에서 XML 데이터의 시각화

HADOOP

하둡에서 XML 데이터의 시각화

내 HDFS에서 나는 XML 처리를하고있을 것입니다. 즉, XML 파일을 처리하고 2 추출 nodes.And이 그래프 플롯 내 X 및 Y 것이다.

HDFS에서이 .Generating 그래프는 빠른을 사용하려면 output.I 내가 할 수있는 방법 miner.how 내가이 어떤 생각을 할 수있는 ...

그렇지 않으면

내 하둡 데이터를 시각화하는 방법이 있나요

해결법

  1. ==============================

    1.HDFS가 작동하는 방법은 미리 정의 된 크기의 블록으로 파일을 분할하는 것입니다. 그냥 일을 좋아한다

    HDFS가 작동하는 방법은 미리 정의 된 크기의 블록으로 파일을 분할하는 것입니다. 그냥 일을 좋아한다

    split -b 64M file.xml
    

    그리고 각 블록을 취하고 연고 데이터 노드에 저장합니다. 이제 HDFS는 64메가바이트의 블록 크기를 가지고 있으며, 파일 크기 1GB의 파일이 16 개 블록으로 분할하고 다른 위치에 저장됩니다 경우. 그래서 맵리 듀스 작업이 XML은 간단한 CSV 또는 TSV 파일과는 달리 구조이기 때문에 XML 파일 블록에서 이해 할 수 없습니다. 그래서 최대한 멀리 볼 수는 HDFS를 통해 XML 파일을 처리 할 수없는 경우 그것 HDFS 블록 크기보다 큰.

  2. from https://stackoverflow.com/questions/15916491/visualization-of-xml-data-from-hadoop by cc-by-sa and MIT license