복붙노트

[HADOOP] Google의 Dremel은 무엇인가요? Mapreduce와 다른 점은 무엇입니까?

HADOOP

Google의 Dremel은 무엇인가요? Mapreduce와 다른 점은 무엇입니까?

Google의 Dremel이 여기에 설명되어 있습니다. Dremel과 Mapreduce의 차이점은 무엇입니까?

해결법

  1. ==============================

    1.이 기사를 확인하십시오. Dremel은 하이브의 미래가 있어야 할 것입니다.

    이 기사를 확인하십시오. Dremel은 하이브의 미래가 있어야 할 것입니다.

    Pig, Hive 등 MapReduce와 그 위에있는 솔루션의 주요 쟁점은 작업 실행과 응답 획득간에 고유 한 대기 시간이 있다는 것입니다. Dremel은 완전히 새로운 접근 방식을 사용합니다 (2010 년 Google에 의해 그 논문에서 나왔습니다) ...

    ... MapReduce가 수행 할 수없는 거의 실시간의 대화식 및 임시 쿼리를 실행합니다. 그리고 돼지와 하이브는 실시간이 아닙니다.

    이 프로젝트에서 나오는 프로젝트를 주시해야합니다. 나도 꽤 새로운거야. 그래서 다른 전문가의 의견도 환영 해!

    편집 : Dremel은 HIVE의 미래 (내가 전에 언급 한 MapReduce가 아닌)가 있어야하는 것입니다. Hive는 MapReduce 작업을 실행하기위한 SQL과 같은 인터페이스를 제공합니다. Hive는 대기 시간이 매우 길기 때문에 임시 데이터 분석에는 실용적이지 않습니다. Dremel은 MapReduce와는 다른 기술을 사용하여 데이터에 대한 인터페이스처럼 매우 빠른 SQL을 제공합니다.

  2. ==============================

    2.Dremel과 MapReduce는 직접 비교할 수 없지만 오히려 상호 보완적인 기술입니다.

    Dremel과 MapReduce는 직접 비교할 수 없지만 오히려 상호 보완적인 기술입니다.

    MapReduce는 데이터 분석을 위해 특별히 설계된 것이 아니라 대규모 노드 집합에서 분산 된 계산 문제를 해결할 수있는 소프트웨어 프레임 워크입니다.

    Dremel은 대용량의 구조화 된 데이터 세트 (예 : 로그 또는 이벤트 파일)에 대한 쿼리를 신속하게 실행하도록 설계된 데이터 분석 도구입니다. 그것은 SQL과 유사한 문법을 ​​지원하지만, 테이블 추가를 제외하고는 읽기 전용입니다. 업데이트 또는 작성 기능을 지원하지 않으며 테이블 인덱스를 지원하지 않습니다. 데이터는 매우 빠른 쿼리 속도에 기여하는 "원주 (columnar)"형식으로 구성됩니다. Google의 BigQuery 제품은 RESTful API를 통해 액세스 가능한 Dremel의 구현입니다.

    "Hive"데이터웨어 하우스 소프트웨어와 함께 Hadoop (MapReduce의 오픈 소스 구현)은 SQL 스타일 구문을 사용하여 방대한 데이터 세트에 대한 데이터 분석을 가능하게합니다. Hive는 기본적으로 쿼리를 MapReduce 함수로 변환합니다. ColumIO 형식을 사용하는 것과 달리 Hive는 테이블 인덱싱과 같은 기술을 사용하여 쿼리를 빠르게 만듭니다.

  3. ==============================

    3.MapReduce는 문제를 위로 나눠서 배포하고 결과를 결합하는 방법에 대한 추상 알고리즘입니다. Dremel은 데이터 집합을 쿼리하고 분석하기위한 특정 도구 인 것으로 보입니다.

    MapReduce는 문제를 위로 나눠서 배포하고 결과를 결합하는 방법에 대한 추상 알고리즘입니다. Dremel은 데이터 집합을 쿼리하고 분석하기위한 특정 도구 인 것으로 보입니다.

  4. from https://stackoverflow.com/questions/6607552/what-is-googles-dremel-how-is-it-different-from-mapreduce by cc-by-sa and MIT license