Hadoop 분할 불가능 TextInputFormat

전체 파일을 분할하지 않고 매퍼로 보낼 수있는 방법이 있습니까?

나는 이것을 읽었으나 중간 파일을 생성하지 않고 같은 일을하는 또 다른 방법이 있는지 궁금합니다. 이상적으로, 나는 Hadoop에 대한 명령 행에서 기존 옵션을 원한다.

Amazon EMR에서 Python 스크립트와 함께 스트리밍 기능을 사용하고 있습니다.

해결법

[HADOOP] JDBC API를 사용하여 하이브 종료 상태 또는 오류 코드를 캡처하는 방법 (0)	2019.07.24
[HADOOP] Elephantbird에서는 HDFS에서 데이터로드가 작동하지 않습니다. (0)	2019.07.24
[HADOOP] Spark 메모리에 TB 파일 실행 (0)	2019.07.24
[HADOOP] 하이브 JDBC Kerberos 연결 오류 (0)	2019.07.24
[HADOOP] modify hadoop-env.sh를 제외하고 hadoop에서 시스템 속성을 지정하는 방법? (0)	2019.07.24

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`