[HADOOP] 어떻게 CSV 형식으로 결과를 출력 할 수 있습니까?
HADOOP어떻게 CSV 형식으로 결과를 출력 할 수 있습니까?
내 hadoop 결과를 .csv 형식으로 출력해야합니다. 내가 어떻게 할거야? 내 코드 : https : //github.com/studhadoop/xml/blob/master/XmlParser11.java
내 코드에 단순히 csvoutputFormat을 포함시켜야합니다. mapreduce API를 사용하고 있습니다.
myjob.sh
bin/hadoop jar /var/root/ALA/ala_jar/clsperformance.jar ala.clsperf.ClsPerf /user/root/ala_xmlrpt/Amrita\ Vidyalayam\,\ Karwar_Class\ 1\ B_ENG.xml /user/root/ala_xmlrpt-outputshell4
bin/hadoop fs -get /user/root/ala_xmlrpt-outputshell4/part-r-00000 /Users/jobsubmit
cat /Users/jobsubmit/part-r-00000 /Users/jobsubmit/output.csv
해결책
고양이에 실종됐다.
cat /Users/jobsubmit/part-r-00000> /Users/jobsubmit/output.csv
해결법
-
==============================
1.TextOutputFormat을 사용할 수 있습니다. 기본 키 / 값 구분 기호는 탭 문자입니다. 드라이버에서 "mapred.textoutputformat.separatorText"속성을 설정하여 구분 기호를 변경할 수 있습니다.
TextOutputFormat을 사용할 수 있습니다. 기본 키 / 값 구분 기호는 탭 문자입니다. 드라이버에서 "mapred.textoutputformat.separatorText"속성을 설정하여 구분 기호를 변경할 수 있습니다.
conf.set("mapred.textoutputformat.separatorText", ",");
from https://stackoverflow.com/questions/16329884/how-can-i-output-hadoop-result-in-csv-format by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] hadoop - namenode에서 연결이 거부되었습니다. (0) | 2019.06.18 |
---|---|
[HADOOP] 추가 기능이있는 HDFS는 어떻게 작동합니까? (0) | 2019.06.18 |
[HADOOP] Apache Spark EOF 예외 (0) | 2019.06.18 |
[HADOOP] 이 작업을 지원하지 않는 트랜잭션 관리자를 사용하여 업데이트 또는 삭제를 시도합니다. (0) | 2019.06.18 |
[HADOOP] hbase 연결이 거부되었습니다. (0) | 2019.06.18 |