복붙노트

[HADOOP] Hadoop 기계 학습 / 데이터 마이닝 프로젝트 아이디어? [닫은]

HADOOP

Hadoop 기계 학습 / 데이터 마이닝 프로젝트 아이디어? [닫은]

저는 대학원 CS 학생 (데이터 마이닝 및 기계 학습)이며 Java 핵심 Java (4 년 이상)에 대해 잘 알고 있습니다. 나는 Hadoop과 Map / Reduce에서 많은 것들을 읽었다.

나는 이제 더 나은 이해를 얻기 위해이 재료에 대한 프로젝트를하고 싶다.

좋은 프로젝트 아이디어는 정말 감사 할 것입니다. 나는 이것을 배우기 위해하고 싶다. 그래서 나는 바퀴를 다시 발명하는 것을 정말로 염두에 두지 않는다. 또한 데이터 마이닝 / 기계 학습과 관련된 모든 것이 보너스 (내 연구에 적합)가 될 것이지만 절대적으로 필요하지는 않습니다.

해결법

  1. ==============================

    1.당신은 당신의 관심사에 대해 아무 것도 쓰지 않았습니다. 그래프 마이닝의 알고리즘이 hadoop 프레임 워크를 통해 구현되었다는 것을 알고 있습니다. 이 소프트웨어 http://www.cs.cmu.edu/~pegasus/와 "PEGASUS : Petal-Scale Graph Mining System - 구현 및 관찰"에서 시작점을 제시 할 수 있습니다.

    당신은 당신의 관심사에 대해 아무 것도 쓰지 않았습니다. 그래프 마이닝의 알고리즘이 hadoop 프레임 워크를 통해 구현되었다는 것을 알고 있습니다. 이 소프트웨어 http://www.cs.cmu.edu/~pegasus/와 "PEGASUS : Petal-Scale Graph Mining System - 구현 및 관찰"에서 시작점을 제시 할 수 있습니다.

    또한이 링크는 질문과 비슷한 내용을 다루고 있습니다. http://atbrox.com/2010/02/08/parallel-machine-learning-for-hadoopmapreduce-a-python-example/하지만 파이썬에 있습니다. Andrew Ng의 "Multicore에서 기계 학습을위한지도 축소"라는 매우 훌륭한 논문이 있습니다.

    비슷한 주제 인 "Large Scale Machine Learning : Parallelism and Massive Datasets"에 대한 NIPS 2009 워크샵이있었습니다. 어떤 종이를 탐색하고 아이디어를 얻을 수 있습니다.

    편집 : 또한 Apache Mahout http://mahout.apache.org/ -> "클러스터링, 분류 및 배치 기반 협업 필터링을위한 핵심 알고리즘은 맵 / 축소 패러다임을 사용하여 Apache Hadoop 위에 구현됩니다"

  2. ==============================

    2.http://www.quora.com/Machine-Learning/What-are-some-good-class-projects-for-machine-learning-using-MapReduce를 참조하십시오.

    http://www.quora.com/Machine-Learning/What-are-some-good-class-projects-for-machine-learning-using-MapReduce를 참조하십시오.

    시작하기 좋은 장난감 프로젝트 : http://www.quora.com/Programming-Challenges-1/What-are-some-good-toy-problems-in-data-science

  3. ==============================

    3.추가 알고리즘을 구현할 수 있도록 Apache Hadoop / Mahout에 기여하지 않으시겠습니까?

    추가 알고리즘을 구현할 수 있도록 Apache Hadoop / Mahout에 기여하지 않으시겠습니까?

    https://cwiki.apache.org/confluence/display/MAHOUT/Algorithms

    "오픈"이라고 표시된 많은 알고리즘이 있습니다. 내 이해를 위해, 그들은 이것을 구현하는 데 도움을 사용할 수 있습니까? 그리고이 목록에서 누락 된 수백 개의 알고리즘이 있습니다.

    어떤 방법 으로든 Hadoop을 사용하여 무언가를하고 싶으니까 무작위로 인터넷 사이트를 방문하는 대신 필요한 것을 묻는 것이 어떻습니까?

  4. ==============================

    4.Hadoop에서 Hierarchical Agglomerative Clustering을 구현하는 효율적인 방법을 생각해 보는 것은 좋은 프로젝트입니다. 여기에는 알고리즘 측면뿐만 아니라 핵심적인 프레임 워크 관련 최적화가 있습니다.

    Hadoop에서 Hierarchical Agglomerative Clustering을 구현하는 효율적인 방법을 생각해 보는 것은 좋은 프로젝트입니다. 여기에는 알고리즘 측면뿐만 아니라 핵심적인 프레임 워크 관련 최적화가 있습니다.

  5. from https://stackoverflow.com/questions/4894396/hadoop-machine-learning-data-mining-project-idea by cc-by-sa and MIT license