Apache Nutch 1.6 发布

Apache Nutch 1.6 发布,该版本修复了超过 20 个 bug,新功能包括:新的 HostNormalizer,可通过 MIME-type 和 Indexer API 的功能增强来动态设置 fetchInterval ,更新 Tika 到 1.2 版本,更新 Autimaton 到 1.11-8 版本。

Apache Nutch 2.1 发布

Apache Nutch 2.1 发布,该版本修复了大约 20 个 bug,更好的 Solr 配置,更新到各个 Gora 依赖等等。详见 http://nutch.apache.org/#05+October+2012+-+Apache+Nutch+v2.1+Released

Apache Nutch v1.5.1 发布

Apache Nutch v1.5.1 发布,这是一个维护版本,主要改进记录包括:

* NUTCH-1404 Nutch script fails to find job file in deploy mode (sidabatra, jnioche)
* NUTCH-1415 release packages to contain top level folder apache-nutch-x.x (snagel via lewismc)
* NUTCH-1400 Remove developer -core option for bin/nutch (jnioche)
* NUTCH-1384 Typo in ParseSegment’s run-method (Matthias Agethle via markus)
* NUTCH-1398 Upgrade to Hadoop 1.0.3 (jnioche)

Apache Nutch v2.0 发布

Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。

Apache Nutch v2.0 版主要改进集中在基于 Apache Gora 存储抽象层的大规模的 Web 爬取,支持大数据存储系统包括:Apache Accumulo™, Apache Avro™, Apache Cassandra™, Apache HBase™, HDFS™ ,同时 2.0 版本大大改进了对 Hadoop 分布式平台的支持,详细的改进内容请看:

http://www.apache.org/dist/nutch/2.0/CHANGES.txt

Copyright © All Rights Reserved · Green Hope Theme by Sivan & schiy · Proudly powered by WordPress