복붙노트

[HADOOP] 어떻게 CSV 형식으로 결과를 출력 할 수 있습니까?

HADOOP

어떻게 CSV 형식으로 결과를 출력 할 수 있습니까?

내 hadoop 결과를 .csv 형식으로 출력해야합니다. 내가 어떻게 할거야? 내 코드 : https : //github.com/studhadoop/xml/blob/master/XmlParser11.java

내 코드에 단순히 csvoutputFormat을 포함시켜야합니다. mapreduce API를 사용하고 있습니다.

myjob.sh

bin/hadoop jar /var/root/ALA/ala_jar/clsperformance.jar ala.clsperf.ClsPerf /user/root/ala_xmlrpt/Amrita\ Vidyalayam\,\ Karwar_Class\ 1\ B_ENG.xml  /user/root/ala_xmlrpt-outputshell4

bin/hadoop fs -get /user/root/ala_xmlrpt-outputshell4/part-r-00000 /Users/jobsubmit


cat /Users/jobsubmit/part-r-00000 /Users/jobsubmit/output.csv

해결책

고양이에 실종됐다.

cat /Users/jobsubmit/part-r-00000> /Users/jobsubmit/output.csv

해결법

  1. ==============================

    1.TextOutputFormat을 사용할 수 있습니다. 기본 키 / 값 구분 기호는 탭 문자입니다. 드라이버에서 "mapred.textoutputformat.separatorText"속성을 설정하여 구분 기호를 변경할 수 있습니다.

    TextOutputFormat을 사용할 수 있습니다. 기본 키 / 값 구분 기호는 탭 문자입니다. 드라이버에서 "mapred.textoutputformat.separatorText"속성을 설정하여 구분 기호를 변경할 수 있습니다.

    conf.set("mapred.textoutputformat.separatorText", ",");
    
  2. from https://stackoverflow.com/questions/16329884/how-can-i-output-hadoop-result-in-csv-format by cc-by-sa and MIT license