Apache Nutch v1.5.1 发布,这是一个维护版本,主要改进记录包括:
* NUTCH-1404 Nutch script fails to find job file in deploy mode (sidabatra, jnioche)
* NUTCH-1415 release packages to contain top level folder apache-nutch-x.x (snagel via lewismc)
* NUTCH-1400 Remove developer -core option for bin/nutch (jnioche)
* NUTCH-1384 Typo in ParseSegment's run-method (Matthias Agethle via markus)
* NUTCH-1398 Upgrade to Hadoop 1.0.3 (jnioche)
Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。
Nutch为我们提供了这样一个不同的选择. 相对于那些商用的搜索引擎, Nutch作为开放源代码 搜索引擎将会更加透明, 从而更值得大家信赖. 现在所有主要的搜索引擎都采用私有的排序算法, 而不会解释为什么一个网页会排在一个特定的位置. 除此之外, 有的搜索引擎依照网站所付的 费用, 而不是根据它们本身的价值进行排序. 与它们不同, Nucth没有什么需要隐瞒, 也没有 动机去扭曲搜索的结果. Nutch将尽自己最大的努力为用户提供最好的搜索结果.
引用来自“光头程序员”的评论
引用来自“myidean”的评论
昨天不是刚发布了V2.0了,怎现在又出现V1.51呀,返古了?
引用来自“myidean”的评论
昨天不是刚发布了V2.0了,怎现在又出现V1.51呀,返古了?
引用来自“phpworkcn”的评论
说了一大堆操蛋话.
主要是他有什么功能
这一句话还不够吗?
主要是他有什么功能