[HADOOP] 분산 컴퓨팅은 어디에서부터 시작해야합니까?
HADOOP분산 컴퓨팅은 어디에서부터 시작해야합니까?
저는 분산 컴퓨팅 기술을 배우는 데 관심이 있습니다. 자바 개발자로서, 아마 Hadoop부터 기꺼이 시작할 것입니다. 먼저 책 / 자습서 / 기사를 추천 해주십시오.
해결법
-
==============================
1.어쩌면 MapReduce 및 분산 컴퓨팅과 관련된 몇 가지 논문을 먼저 읽어 볼 수 있습니다. 다음은 제가 추천하고자하는 것들입니다 :
어쩌면 MapReduce 및 분산 컴퓨팅과 관련된 몇 가지 논문을 먼저 읽어 볼 수 있습니다. 다음은 제가 추천하고자하는 것들입니다 :
반면에 Hadoop을 더 잘 알고 싶다면 Hadoop MapReduce 프레임 워크 소스 코드를 읽기 시작할 수 있습니다.
-
==============================
2.현재 bookwise 나는 Hadoop A Definitive Guide를 살펴볼 것입니다. Tom White가 Hadoop에서 지금까지 잘 해왔고, Cloudera에서 Doug Cutting (Hadoop 제작자)과 함께 작업했습니다.
현재 bookwise 나는 Hadoop A Definitive Guide를 살펴볼 것입니다. Tom White가 Hadoop에서 지금까지 잘 해왔고, Cloudera에서 Doug Cutting (Hadoop 제작자)과 함께 작업했습니다.
또한 무료 편으로 UMD의 지미 린 (Jimmy Lin)은 MapReduce를 사용한 데이터 집약적 텍스트 처리라는 책을 썼습니다. 다음은 최종 제작 전 버전 (저자가 웹 사이트에서 제공 한 링크)에 대한 링크입니다.
-
==============================
3.Hadoop은 모든 분산 컴퓨팅 문제를 해결하는 데 반드시 필요한 도구는 아닙니다. 그것의 힘에도 불구하고, 그것에는 또한 아주 가파른 학습 곡선 및 소유권의 비용이있다. 요구 사항을 명확히하고 HTCondor, JPPF 또는 GridGain과 같은 Java 세상에서 적절한 대안을 찾아 볼 수 있습니다 (언급하지 않은 것에 대해서는 사과합니다).
Hadoop은 모든 분산 컴퓨팅 문제를 해결하는 데 반드시 필요한 도구는 아닙니다. 그것의 힘에도 불구하고, 그것에는 또한 아주 가파른 학습 곡선 및 소유권의 비용이있다. 요구 사항을 명확히하고 HTCondor, JPPF 또는 GridGain과 같은 Java 세상에서 적절한 대안을 찾아 볼 수 있습니다 (언급하지 않은 것에 대해서는 사과합니다).
-
==============================
4.Yahoo!의 자료는 다음과 같습니다. 개발자 네트워크
Yahoo!의 자료는 다음과 같습니다. 개발자 네트워크
튜토리얼 :
http://developer.yahoo.com/hadoop/tutorial/
입문 과정 (Silverlight, 로그인 필요) :
http://yahoo.hosted.panopto.com/CourseCast/Viewer/Default.aspx?id=281cbf37-eed1-4715-b158-0474520014e6
-
==============================
5.All Things Hadoop Podcast http://allthingshadoop.com/podcast에는 좋은 콘텐츠와 좋은 손님이 있습니다. 많은 것은 분산 컴퓨팅을 시작하는 데 중점을 둡니다.
All Things Hadoop Podcast http://allthingshadoop.com/podcast에는 좋은 콘텐츠와 좋은 손님이 있습니다. 많은 것은 분산 컴퓨팅을 시작하는 데 중점을 둡니다.
-
==============================
6.MIT 6.824가 가장 좋습니다. Hadoop과 관련된 Google 논문 읽기만으로는 충분하지 않습니다. 더 깊이 가고 싶다면 체계적인 코스 학습이 필요합니다.
MIT 6.824가 가장 좋습니다. Hadoop과 관련된 Google 논문 읽기만으로는 충분하지 않습니다. 더 깊이 가고 싶다면 체계적인 코스 학습이 필요합니다.
-
==============================
7.Hadoop보다 덜 복잡한 분산 컴퓨팅 플랫폼을 배우려는 경우 Zillabyte를 사용해보십시오. 플랫폼에서 응용 프로그램을 빌드하려면 Ruby 또는 Python을 알아야합니다.
Hadoop보다 덜 복잡한 분산 컴퓨팅 플랫폼을 배우려는 경우 Zillabyte를 사용해보십시오. 플랫폼에서 응용 프로그램을 빌드하려면 Ruby 또는 Python을 알아야합니다.
LoLo가 말했듯이, Hadoop은 강력한 솔루션이지만 처음에는 거칠 수 있습니다.
분산 컴퓨팅에 대해 배우기위한 자료는 http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-824-distributed-computer-ystemsystems-engineering-spring-2006/syllabus/를 참조하십시오. 코스에서 추천하는 여러 가지 리소스가 있습니다.
from https://stackoverflow.com/questions/2818567/where-do-i-start-with-distributed-computing by cc-by-sa and MIT license
'HADOOP' 카테고리의 다른 글
[HADOOP] 수백만 개의 레코드를 실시간으로 쿼리 / 수집 - hadoop? hbase? 카산드라? (0) | 2019.07.05 |
---|---|
[HADOOP] 학습을 시작하는 방법 hadoop [닫힘] (0) | 2019.07.05 |
[HADOOP] Twitter (소셜 네트워킹) 데이터 세트 (0) | 2019.07.05 |
[HADOOP] Hadoop MapReduce 대 MPI (Spark vs Mahout 대 Mesos) - 다른 것을 계속 사용할 때? (0) | 2019.07.05 |
[HADOOP] 이름 노드 대 보조 이름 노드 (0) | 2019.07.05 |