복붙노트

[HADOOP] 맵리 듀스를 사용하여 K-D 트리를 구축?

HADOOP

맵리 듀스를 사용하여 K-D 트리를 구축?

나는 이미지 기능에 대한 KD 트리 (독립)을 구축을 위해 노력하고 있습니다. 나는 기능은 가정하자 1000 개 부동 소수점 값을 포함, 이미지 기능을 추출했다.

사용 분류에 따라 클러스터의 노드 (예를 들어, 고양이, 개, 총) 즉 사이에 이미지를 배포하는지도를-줄일 수 있습니다. 각 노드는 비슷한 이미지의 무리를 포함 및 다음 각 노드에서 이미지의 KD 트리를 구축 할 것입니다. 나는 나무를 구축 할 수있는 방법에 대한 혼란 스러워요.

그래서 어떻게지도-감소하여 KD 트리를 만들 수 있습니까? 각 노드는 오른쪽 트리를 포함한? 어떤 이미지를 배포 할 수있는 논리가 될 수 있을까? 내가 나무에서 이미지 특징 벡터를 추가해야하는지 기준으로 KD-트리를 구축하는 동안 (즉, 왼쪽 또는 오른쪽 자식)?

어떤 도움을 사전에 appreciated.Thanks입니다.

해결법

  1. ==============================

    1.나는 K-D-트리 데이터에 대한 옳은 일이라고 생각하지 않습니다. 다음은 위키 백과 그것에 대해 말씀입니다 :

    나는 K-D-트리 데이터에 대한 옳은 일이라고 생각하지 않습니다. 다음은 위키 백과 그것에 대해 말씀입니다 :

    귀하의 특징 벡터는 매우 가능성이 약 10 ^ 300 이미지를 가지고 있어야한다는 것을 의미 차원 (1000),있다.

    난 당신이 고차원 데이터에 대한 언급 대략 가까운 이웃 검색의 하나입니다 소재지에 민감한 해시, 보는 것이 좋습니다.

    위키 백과는 뭔가 복잡한 배울 수있는 가장 좋은 장소는 항상 아니기 때문에, 나는 당신이 대신 ETH 취리히의 데이터 마이닝 과정의 각 강의 슬라이드를 살펴 보시기 바랍니다. 단지 내가 현재 학기에이 과정을 복용하고 있음을 발생합니다.

  2. from https://stackoverflow.com/questions/10984168/building-a-k-d-tree-using-mapreduce by cc-by-sa and MIT license