복붙노트

[HADOOP] Mahout을 사용하여 속도를 높이려면 Mahout in Action을 구입할 가치가 있습니까? 아니면 다른 우수한 소스가 있습니까?

HADOOP

Mahout을 사용하여 속도를 높이려면 Mahout in Action을 구입할 가치가 있습니까? 아니면 다른 우수한 소스가 있습니까?

저는 현재 Apache Mahout을 매우 평범한 사람으로 생각하고 있으며 Mahout in Action 책을 구입할 생각입니다. 불행하게도이 책의 가치에 대한 아이디어를 얻는 데 정말 어려움을 겪고 있습니다. Manning Early Access Program 책 (현재 베타 버전의 전자 책으로 만 제공됨)으로 볼 수 있습니다. 서점에서 직접 보지 마라.

아무도 Mahout 및 / 또는 Mahout 웹 사이트를 보완 할 수있는 다른 출처와 함께 속도를 높이는 좋은 (또는 덜 좋은) 가이드로 이것을 추천 할 수 있습니까?

해결법

  1. ==============================

    1.Mahout 커미터와 책의 공동 저자라고 말하면, 나는 그것이 가치가 있다고 생각한다. ;-)

    Mahout 커미터와 책의 공동 저자라고 말하면, 나는 그것이 가치가 있다고 생각한다. ;-)

    그러나 진지하게, 당신은 무엇을하고 있습니까? 어쩌면 우리는 당신에게 약간의 자원을 가리킬 수 있습니다.

    Mahout의 일부 측면은 독자적으로 파악하기가 어렵습니다. 우리는 메일 링리스트의 질문에 답하기 위해 열심히 노력하지만 샘플 코드와 로드맵을 갖는 데 도움이 될 수 있습니다. 그 중 일부가 없으면 좋은 질문을하기조차 어렵습니다.

  2. ==============================

    2.또한 공동 저자입니다. "말의 입에서"라는 말은 아마도 Mahout 자체에 대한 가장 완벽한 작성일 것입니다. 저기에 좋은 블로그 게시물이 있고, 일반적으로 기계 학습에 관한 좋은 책들이 많이 있습니다 (저는 집단 지성이 넓은 빛의 소개처럼 좋아합니다). user@mahout.apache.org에는 책 포럼 (http://www.manning-sandbox.com/forum.jspa?forumID=623)과 마찬가지로 FWIW라는 책을 좋아한다고 말하는 사람들이 있습니다. 네가 원했던 것이 아니라면 전자 책. 클러스터링에는 6 개의 장이 있습니다.

    또한 공동 저자입니다. "말의 입에서"라는 말은 아마도 Mahout 자체에 대한 가장 완벽한 작성일 것입니다. 저기에 좋은 블로그 게시물이 있고, 일반적으로 기계 학습에 관한 좋은 책들이 많이 있습니다 (저는 집단 지성이 넓은 빛의 소개처럼 좋아합니다). user@mahout.apache.org에는 책 포럼 (http://www.manning-sandbox.com/forum.jspa?forumID=623)과 마찬가지로 FWIW라는 책을 좋아한다고 말하는 사람들이 있습니다. 네가 원했던 것이 아니라면 전자 책. 클러스터링에는 6 개의 장이 있습니다.

  3. ==============================

    3.구식 인 책의 많은 부분이 있으며, 현재의 책 뒤쪽에는 버전 또는 두 부분이 있습니다. 또한 본문에는 몇 가지 오류가 있으며, 특히 예제에서는 오류가 있습니다. 이것은 토론 된 결과를 복제하려고 할 때 약간 까다로운 일이 될 수 있습니다.

    구식 인 책의 많은 부분이 있으며, 현재의 책 뒤쪽에는 버전 또는 두 부분이 있습니다. 또한 본문에는 몇 가지 오류가 있으며, 특히 예제에서는 오류가 있습니다. 이것은 토론 된 결과를 복제하려고 할 때 약간 까다로운 일이 될 수 있습니다.

    또한, mahout의 가장 성숙한 부분 인 추천 시스템, 미각은 분산되어 있지 않습니다. 나는 이것이 왜 사자의 나머지와 함께 포장되는지 정말로 확신하지 않는다. 이것은 mahout 자체보다는 소프트웨어 패키지에 대한 불만입니다.

  4. ==============================

    4.현재 최고입니다. 아마도 제품만큼 성숙한 것 같습니다. 어떤 측면은 다른 것들보다 낫다. 기본 구현에 대한 통찰력은 초보자들에게 리눅스, 맥 OSX 등으로 시작하고 실행하는 좋은 방법이다. 권장 사항을 업데이트 된 상태로 유지하는 방법에 대한 명확한 전략을 정의하는 것이 좋습니다. 꽤 얇은 생산 사례. 출발점으로는 좋지만 훨씬 더 많이 필요합니다. 저자는 최선의 시도를 돕지 만 꽤 새로운 제품입니다. 결국, 네, 그것을 사십시오.

    현재 최고입니다. 아마도 제품만큼 성숙한 것 같습니다. 어떤 측면은 다른 것들보다 낫다. 기본 구현에 대한 통찰력은 초보자들에게 리눅스, 맥 OSX 등으로 시작하고 실행하는 좋은 방법이다. 권장 사항을 업데이트 된 상태로 유지하는 방법에 대한 명확한 전략을 정의하는 것이 좋습니다. 꽤 얇은 생산 사례. 출발점으로는 좋지만 훨씬 더 많이 필요합니다. 저자는 최선의 시도를 돕지 만 꽤 새로운 제품입니다. 결국, 네, 그것을 사십시오.

  5. ==============================

    5.몇 주 전에 책 가져 왔어. 추천. 저자는 메일 링리스트에서도 매우 적극적으로 활동하고 있으며이 프로젝트에는 많은 에너지가 있습니다.

    몇 주 전에 책 가져 왔어. 추천. 저자는 메일 링리스트에서도 매우 적극적으로 활동하고 있으며이 프로젝트에는 많은 에너지가 있습니다.

  6. ==============================

    6.Paco Nathan의 엔터프라이즈 데이터 워크 플로우를 계단식으로 읽는 것도 고려해 볼 수 있습니다. R 또는 SAS에서 내 보낸 클러스터에서 PMML을 실행할 수 있습니다. 그것은 Mahout in Action에 대해 나쁜 말을하는 것이 아닙니다. 저자는 훌륭한 일을했고, 유익하고 재미있는 시간과 노력을 분명히했습니다. 이는 Mahout을 넘어서는 더 많은 제안입니다. 그것은 현재 사용자 친화적 인 경우에 그것은 그런 종류의 견인을 받고 있지 않습니다.

    Paco Nathan의 엔터프라이즈 데이터 워크 플로우를 계단식으로 읽는 것도 고려해 볼 수 있습니다. R 또는 SAS에서 내 보낸 클러스터에서 PMML을 실행할 수 있습니다. 그것은 Mahout in Action에 대해 나쁜 말을하는 것이 아닙니다. 저자는 훌륭한 일을했고, 유익하고 재미있는 시간과 노력을 분명히했습니다. 이는 Mahout을 넘어서는 더 많은 제안입니다. 그것은 현재 사용자 친화적 인 경우에 그것은 그런 종류의 견인을 받고 있지 않습니다.

    Mahout 사용자 경험은 다소 고르지 만 지능형 시스템과 라이프 사이클을 어떻게 개발하고 업데이트하는지 명확하게 알 수는 없습니다. Mahout은 실제로 학자들에게 받아 들여지지 않습니다. Matlab이나 R을 사용할 가능성이 더 큽니다. Mahout 문서에서는 임의의 포리스트 구현이 간신히 작동하고 문서에 오류가있는 예제 등이 있습니다. 실망스럽고 병렬 처리와 확장 성은 다음과 같습니다. Mahout 루틴은 알고리즘에 의존합니다. 나는 현재 Mahout이 어디서든 단단히 움직이는 것을 보지 않는다. 다시 IMO이다. 나는 틀렸어!

    http://shop.oreilly.com/product/0636920028536.do

  7. from https://stackoverflow.com/questions/4510471/is-it-worth-purchasing-mahout-in-action-to-get-up-to-speed-with-mahout-or-are-t by cc-by-sa and MIT license