복붙노트

[HADOOP] 1.x, 2.2 및 0.23 중 어느 것을 선택해야합니까?

HADOOP

1.x, 2.2 및 0.23 중 어느 것을 선택해야합니까?

안녕하세요 저는 Hadoop을 처음 사용하고 버전 이름과 혼동을 겪었으며 1.x (훌륭한 지원 및 학습 자료), 2.2 또는 0.23 중에서 어느 것을 사용해야하는지 잘 모릅니다.

나는 hadoop이 v0.23 (link1)에서 완전히 YARN으로 이동한다는 것을 읽었습니다. 그러나 동시에 hadoop v2.0이 YARN (link2)으로 이동하고 Hadoop 2.2 자체에서 YARN 구성 파일을 볼 수있는 웹상의 모든 것이 있습니다.

감사.

최신 정보 답장을 보내 주셔서 감사합니다. 나는 hadoop2.2를 사용하여 끝났고, 유명한 튜토리얼과 리소스는 모두 구식이기 때문에, v2.2를 시작하기에 좋은 책이 하나 발견되었지만.

hadoop v2.2를 지원합니다.

소스 코드는 github https://github.com/tomwhite/hadoop-book에서 제공됩니다.

github에서 언급했듯이이 책의 코드는

This version of the code has been tested with:
 * Hadoop 1.2.1/0.22.0/0.23.x/2.2.0
 * Avro 1.5.4
 * Pig 0.9.1
 * Hive 0.8.0
 * HBase 0.90.4/0.94.15
 * ZooKeeper 3.4.2
 * Sqoop 1.4.0-incubating
 * MRUnit 0.8.0-incubating

그것이 도움이되기를 바란다. ... !!!

해결법

  1. ==============================

    1.몇 가지 활성 릴리스 시리즈가 있습니다. 1.x 릴리즈 시리즈는 0.20의 연속물입니다. 릴리스 시리즈. 0.23이 발표 된 지 몇 주 후, 0.20.205로 알려진 0.20 지점은 번호가 다시 매겨졌습니다. 0.20.205와 1.0 사이에는 아무런 기능적 차이가 없습니다. 이것은 단지 번호를 다시 매기는 것입니다.

    몇 가지 활성 릴리스 시리즈가 있습니다. 1.x 릴리즈 시리즈는 0.20의 연속물입니다. 릴리스 시리즈. 0.23이 발표 된 지 몇 주 후, 0.20.205로 알려진 0.20 지점은 번호가 다시 매겨졌습니다. 0.20.205와 1.0 사이에는 아무런 기능적 차이가 없습니다. 이것은 단지 번호를 다시 매기는 것입니다.

    0.23에는 MapReduce 2라는 새로운 MapReduce 런타임과 분산 응용 프로그램을 실행하기위한 일반적인 자원 관리 시스템 인 YARN (Yet Another Resource Negotiator)이라는 새로운 시스템에 구현 된 몇 가지 주요 새로운 기능이 포함되어 있습니다. 마찬가지로, 2.x 릴리스는 0.23 릴리스 시리즈의 연속입니다. 따라서 2.2는 YARN도 지원합니다.

    Hadoop 2.2 릴리스 노트에 따르면

    방금 학습을 시작한 이후 Cloudera 배포판부터 시작하는 것이 좋습니다. CDH 4.5에는 찾고있는 원사 기능이 포함되어 있습니다. HortonWorks 배포판을 사용해 볼 수도 있습니다. 이러한 공급 업체와 함께라면 Hive, Pig와 같은 구성 요소 버전이 Hadoop 설치 작업에 대해 걱정할 필요가 없다는 이점이 있습니다.

  2. ==============================

    2.나는 좋은 지식을 제공하는 hadoop-2.2.0으로 시작하도록 추천했다. 업계는 YARN 자체를 선호하며 제작 2.x에서만 존재합니다.

    나는 좋은 지식을 제공하는 hadoop-2.2.0으로 시작하도록 추천했다. 업계는 YARN 자체를 선호하며 제작 2.x에서만 존재합니다.

  3. from https://stackoverflow.com/questions/21858784/which-hadoop-version-should-i-choose-among-1-x-2-2-and-0-23 by cc-by-sa and MIT license