solr 4.0 正式发布了

随着 lucene 4.0 的正式发布, ugg australia pas cher 10月12日,solr 4.0 也正式发布了,跟之前的预测稍差了一点时间。发行包跟之前的结构基本一致, puma sneakers 运行起来后,管理界面有了很大的改进, magasin uggs pas cher 加入了监控、core 管理等, ugg soldes UI 也相对漂亮了。 ugg australia pas cher femme 效果如下所示: 之前一直备受关注的实时搜索、solrCloud等功能有待后面有时间了慢慢挖掘。

solrconfig.xml 之 其他索引设置

以下是另外一些比较重要的索引的设置:
maxBufferedDocs:
设置索引刷新到磁盘前,缓存在内存中文档的数量。Solr 默认情况下没有设置该值
ramBufferSizeMB:
单位为 M, moncler 设置索引刷新到磁盘前, timberland homme 缓存在内存时使用的最大内存。 ugg soldes 该参数和 maxBufferedDocs 同时设置,只要达到其中的一个限制时, ugg enfant 都将缓存写入磁盘
maxMergeDocs:
该值用于设置单个片段最大的文档数量。达到这个值时, Timberland Homme Pas Cher 当前片段将被关闭, ugg australia pas cher 然后创建一个新的片段。
maxFieldLength:
字段内容经分词后会产生许多的 tokens,当这些 tokens 达到该值的设置后, ugg australia 其他的 其他的 tokens 会被忽略。

schema.xml 中的字段类型定义

字段类型定义在 schema.xml 的 types 这个元素里头。 timberland pas cher 这里是一个字段类型定义的例子

&lt;fieldType name=&quot;textTight&quot;</p> <p>positionIncrementGap=&quot;100&quot; &gt;</p> <p>&lt;analyzer&gt;</p> <p>&lt;tokenizer/&gt;</p> <p>&lt;filter</p> <p>synonyms=&quot;synonyms.txt&quot; ignoreCase=&quot;true&quot; expand=&quot;false&quot;/&gt;</p> <p>&lt;filter</p> <p>generateWordParts=&quot;0&quot; generateNumberParts=&quot;0&quot;</p> <p>catenateWords=&quot;1&quot; catenateNumbers=&quot;1&quot; catenateAll=&quot;0&quot;/&gt;</p> <p>&lt;filter/&gt;</p> <p>&lt;filter</p> <p>language=&quot;English&quot; protected=&quot;protwords.txt&quot;/&gt;</p> <p>&lt;filter/&gt;<br /> &lt;/analyzer&gt;</p> <p>&lt;/fieldType&gt;

以上例子的第一行包含了字段类型名称, puma pas cher textTight, uggs pas cher en ligne 和字段的处理的实现类, ugg australia solr.TextField。 moncler pas cher 这一实现类用于保证字段可以被正确的处理。 ugg classic Basse 在这个文件里, Timberland Femme 一些事项类采用了缩写,

Solr 字段类型

Solr 的一个字段类型包括四个部分:

DIH 之 Entity Processors

Entity processors 负责抽取数据, puma pas cher 然后发送给 Solr 索引。例子中的 实体包括视图和表中的数据。
以下是 Entity processors 中常用的属性:
datasource:
指定数据源的名称,当有多个数据源时, Timberland Soldes 需要该名称来决定使用哪个数据源
name:
必选,指定实体唯一的名称
pk:
实体的主键, timberland homme 只有到使用delta-imports是, moncler soldes 它的值才是必须。
processor:
默认是 SQLEntityProcessor,如果数据源不是关系型数据库,该值必填
onError:
容错值, timberland 可选有:abort|skip|continue,默认为 abort。 bottes timberland skip 是跳过当前document,continue 是忽略错误继续执行。

ReplicationHandler 的 HTTP API

可以通过以下 HTTP 命令来控制 ReplicationHandler 的操作
http://master_host:port/solr/replication?command=enablereplication
使主服务器的复制可用
http://master_host:port/solr/replication?command=disablereplication
使主服务器的复制不可用
http://host:port/solr/replication?command=indexversion
获得主服务器或从服务器最新的索引版本
http://slave_host:port/solr/replication?command=fetchindex
强制从服务器从主服务器拉取索引, ugg outlet france 该过程可以传递 <lst name=”slave”> 下的参数, ugg pas cher femme 如主服务的url、压缩参数等
http://slave_host:port/solr/replication?command=abortfetch
让某从服务器不再从主服务器拉取索引
http://slave_host:port/solr/replication?command=enablepoll
使某从服务器可以从主服务器拉取修改的索引
http://slave_host:port/solr/replication?command=details
返回配置和当前状态
http://host:port/solr/replication?command=filelist&indexversion=<index-version-number>
返回指定主机的索引文件列表, Moncler doudoune pas cher 可以指定版本号
http://master_host:port/solr/replication?command=backup
如果有新的commit, Moncler enfant doudoune pas cher 将备份索引库,

复制配置文件

使用 confFiles 参数指定需要复制的配置文件。 ugg femme pas cher 只有在主服务器 conf 目录下的文件才会被复制。 chaussure Puma
solr 的配置文件复制只会发生在索引复制之后,即使主服务器中的配置文件修改了,只有在新的 commit/optimize 之后,才会发生配置文件复制。 ugg australia pas cher
为了防止失败,solr 在将配置文件替换到 conf 目录前,会先将配置文件复制到临时目录中。 doudoune moncler 旧的配置文件会被重命名,还是放在 conf 目录下,ReplicationHandler 不会自动删除这些旧的配置文件。 ugg pas cher femme
当有配置文件被复制到从服务器中,ReplicationHandler 会发起一条让 core 重新加载的命令。

带 IK 分词器的 Luke

    Luke 之前的文章中有介绍过,这次提供一个带IK分词器的luke, timberland chaussures 点击这里下载。该版本是在 luke 3.5 基础上加入了 IK2012 的包, Timberland Soldes 可以对solr3.5(lucene3.5)、solr3.6(lucene3.6)的词库进行查看。 这样, bottes ugg 在 luke 的 plugins 界面中, bottes ugg pas cher 可以下拉选择到IK 的分词器, Timberland Pas Cher 输入相应的文本,就能查看到分词的结果。如下图所示: luke&IK在 search 界面里,也可以调出 IK 分词器对关键字进行分词,然后测试搜索结果。

合并因子(mergeFactor)

mergeFactor 是 lucene 用于控制索引片段的数量,当数据大于 mergeFactor 的值时,这些索引将被合并成一个大的片段。 bottes timberland 当提交索引数据时,它将被加到最新打开的片段中。 Timberland Femme Pas Cher 当一个新的索引片段被创建时,就会去检查这个合并因子。 chaussure Puma 这个合并因子的大小对索引和搜索的速度有着影响,如果这个索引因子比较小,也就是索引片段比较少,这样会相对比较频繁促发索引合并,带来的好处时索引文件比较少,搜索时需要扫描的索引文件也就比较少,搜索速度就会相对提高。 soldes moncler 如果这个因子比较大,这样索引合并的次数次数机会减少,而索引片段会增多,这样搜索时需要访问的文件数就增多了,这样搜索速度就会相对慢点。所以该因子的设定需要一个权衡,同时保证搜索和索引都相对快速。 soldes puma chaussure 在示例的 solrconfig.xml 中,该因子默认值为 10,就是出于一个合理的出发点去考虑的。

磨刀不误砍柴工

搜索群里经常遇到有刚入门的朋友问一下 Solr 比较常用功能的使用方法,如高亮、集成中文切词、和现有项目集成、怎么使用查询返回的 XML 数据、如何做 Suggest、如何跟现有的应用整合、以及如何使用DIH。。。 basket timberland 确实, moncler 使用 Solr 快速搭建一个搜索时, chaussure timberland 首先遇到的就是这些问题,搞定这些问题, chaussures puma 一个搜索就出来了。看到大家问这些问题时,很想说暂停下现在翻译的事, ugg australia 去写一些这方面快速使用 Solr 的文章,一则方便大家快速搭建搜索应用,二则大家问这些问题时, ugg australia pas cher 可以直接贴网址给大家,能很快吸引很多初学者来这里。后来想想,还是不要这么操之过急,我自己应该先把基础打好,踏实的翻译 Solr 基础功能的文章,把这些基础的东西搞明白了,快速实现一些功能会更加快捷,高手都是在练基本功,乔丹在热身时总在练投篮, bottes ugg 其他球员总是在飞来飞去的灌篮。所以我想我也应该继续练基本功,继续学习和翻译 Solr 基础功能。

Copyright © All Rights Reserved · Green Hope Theme by Sivan & schiy · Proudly powered by WordPress · 闽ICP备18020075号