请问各位大神,在hadoop在怎么构建样本间的k近邻graph啊

zarchary 发布于 2013/08/20 22:15
阅读 185
收藏 1
例如在,一个图有N的数据点,每个数据点x(j)我们找到与它最接近的k个点,x(j)与这些近邻的点用边连接。如果x(j)与x(i)连接,它们的weight值为1。大体比较简单,但是要在hadoop,如有代码请提供下,谢谢。如果有高效构建knn graph会更好。
加载中
0
中山野鬼
中山野鬼
我估计你这个是折腾数据与处理任务的关联分析。以看分布式数据如何组织被业务流程利用。这块属于很核心的引擎该做的事情。哈。。。原型我可以告诉你图论,对应的代码实现,python和C++都有网络图处理的库。自己可以搜索一下。不过要说背靠业务,想高效,这个,要么公司行为,要么自己写。指望别人给,也给不了。哈。
0
n
newlife867

http://mahout.apache.org/

这hadoop 上的ML算法包,包括各种ML算法,涉及聚类,分类器等等。

也包含图论算法,knn应该也在其中。

0
zarchary
zarchary
谢谢两位的回答,这是我自己网上找到的 https://github.com/01org/graphbuilder 。我还找到了一篇文章关于一种knn-graph approximation via hashing,个人感觉还是挺有用, http://dl.acm.org/citation.cfm?id=2324847
返回顶部
顶部