복붙노트

[HADOOP] hadoop 대 teradata 차이점은 무엇입니까?

HADOOP

hadoop 대 teradata 차이점은 무엇입니까?

나는 Teradata를 만진 적이있다. 나는 결코 hadoop을 만지지 않았다. 그러나 어제부터, 나는 그것에 관한 약간의 연구를하고있다. 둘 모두에 대한 설명으로, 그들은 꽤 상호 교환 적으로 보일 수 있지만, 어떤 논문에서는 그것들이 다른 목적을 위해 쓰여지는 것으로 써져있다. 하지만 내가 찾은 것은 모호합니다. 나는 혼란 스럽다.

둘 다 경험 한 사람이 있습니까? 그들 사이의 심각한 차이점은 무엇입니까?

간단한 예제 : 수십억 개의 원시 데이터 행을 변환하고 DWH로 구성 할 ETL을 작성하려고합니다. 그런 다음 일부 리소스를 사용하여 값 비싼 분석을 수행하십시오. 왜 TD를 사용합니까? 왜 하둡인가? 왜 그렇지 않은가?

해결법

  1. ==============================

    1.필자는이 기사가 'MapReduce and Parallel DBMSs : Friends or Foes'라는 제목의 기사가 각 기술이 가장 잘 작동하는 상황을 설명하는 좋은 기회라고 생각합니다. 간단히 말해, Hadoop은 구조화되지 않은 데이터를 저장하고 병렬 변환을 실행하여 들어오는 데이터를 '위생적으로 처리'하는 데 탁월합니다. 복잡한 데이터베이스를 신속하게 실행하는 데 탁월한 성능을 발휘합니다.

    필자는이 기사가 'MapReduce and Parallel DBMSs : Friends or Foes'라는 제목의 기사가 각 기술이 가장 잘 작동하는 상황을 설명하는 좋은 기회라고 생각합니다. 간단히 말해, Hadoop은 구조화되지 않은 데이터를 저장하고 병렬 변환을 실행하여 들어오는 데이터를 '위생적으로 처리'하는 데 탁월합니다. 복잡한 데이터베이스를 신속하게 실행하는 데 탁월한 성능을 발휘합니다.

  2. ==============================

    2.저는이 분야의 전문가는 아니지만 coursera.com 과정의 데이터 과학 개론에서 MapReduce와 데이터베이스 비교 및지도 내의 병렬 데이터베이스에 대한 강의를 강의 강의 섹션에서 줄입니다.

    저는이 분야의 전문가는 아니지만 coursera.com 과정의 데이터 과학 개론에서 MapReduce와 데이터베이스 비교 및지도 내의 병렬 데이터베이스에 대한 강의를 강의 강의 섹션에서 줄입니다.

    다음은 MapReduce와 RDBMS의 비교에 대한 요약입니다 (반드시 병렬 RDMBS 일 필요는 없음). 한 가지 기억해야 할 점은 PIG, Hive 등과 같은 Hadoop 확장을 포함하면 비교가 다르다는 것입니다. 이러한 기능 / 속성 중 일부를 추가하는 MapReduce 확장을 넣을 것입니다.

    RDBMS에는 있지만 네이티브 MapReduce에는없는 일부 기능 / 속성 :

    MapReduce (일반 RDBMS와 관련하여 Parallel RDBMS 일 필요는 없음)

  3. ==============================

    3.시작하려면 바닐라 아파치 하둡은 100 % 오픈 소스입니다. 그러나 컨설팅과 함께 상업적 지원이 필요한 경우 Cloudera, MapR, HortonWorks 등과 같은 회사가 있습니다.

    시작하려면 바닐라 아파치 하둡은 100 % 오픈 소스입니다. 그러나 컨설팅과 함께 상업적 지원이 필요한 경우 Cloudera, MapR, HortonWorks 등과 같은 회사가 있습니다.

    Hadoop은 버그 수정 및 지속적인 개선을 통해 성장하는 커뮤니티의 지원을받습니다. Hadoop 스토리지 모델 HDFS는 대용량 데이터를 처리하는 것으로 입증 된 Google의 GFS 아키텍처를 기반으로합니다. 또한 Hadoop 분석 모델 Map Reduce는 Google의 Map Reduce Model을 기반으로합니다.

    Hadoop은 페이스 북, 야후, 트위터, 이베이 (eBay) 등 테크 자이언츠가 데이터의 대량을 실시간으로 저장하고 분석하고 수동적으로 사용합니다.

    귀하의 질문에 대해 ETL 시스템은 귀하가 보게 될이 슬라이드를 읽습니다.

    Ok, 왜 하둡인가?

    좋아, 왜 TD인가?

  4. ==============================

    4.나는이 질문에 여러 번 질문을 해왔다. 내가 보통주는 대답은 자동차 유추이다 (나는 자동차 사람이 아니기 때문에 꽤 어리 석다. 그러나 그것은 효과가있는 것처럼 보인다)

    나는이 질문에 여러 번 질문을 해왔다. 내가 보통주는 대답은 자동차 유추이다 (나는 자동차 사람이 아니기 때문에 꽤 어리 석다. 그러나 그것은 효과가있는 것처럼 보인다)

    다시 말해, Teradata는 업무상 중요한 프로세스 (운영보고, 엔터프라이즈보고, 의사 결정 지원 등)를 수행하는 신뢰할 수있는 작업대입니다. 하둡은 당신이이 일을 많이 할 수있는 곳이지만, 어느 날 아침에 와서 누군가가 패치를 적용했거나 갑자기 "너무"받았기 때문에 규정 보고서를 작성할 수 없다는 사실에 놀란다면 놀라지 마십시오. 많은 작은 파일 "문제.

    비유하자면 너무 비싸지 않고 제조 업체 제품 (dbms 및 / 또는 자동차)을 즉시 사용할 수있게 되려면 Teradata가 좋은 옵션입니다. 다른 한편, 당신이 후드 아래에서 수리를하고 싶다면, 기화기 (또는 무엇이든)를 교환하고, 기어 비율을 조정하고, 당신이 국가 또는 도시 운전인지, 터보 차저에 볼트로 고정하는지, 그리고 / 또는 귀하의 가족이 주말에 차고에서 보내는 시간에 대해 불만을 토로합니다 - 하둡이 당신을위한 장소입니다.

    IMHO, Most, 모든 조직이 그렇지는 않더라도 둘 다 필요합니다. 이게 도움이 되길 바란다 :-)

  5. from https://stackoverflow.com/questions/14621862/hadoop-vs-teradata-what-is-the-difference by cc-by-sa and MIT license