Warning: Use of undefined constant ‘the_content’ - assumed '‘the_content’' (this will throw an Error in a future version of PHP) in /www/wwwroot/solrcn.com/wp-content/themes/green-hope/header.php on line 29

分词器

文本字段的分词器配置在 schema.xml 中的 <analyzer> 元素下的:

<br />
&lt;fieldType name=&quot;text&quot; class=&quot;solr.TextField&quot;&gt;<br />
	&lt;analyzer type=&quot;index&quot;&gt;<br />
		&lt;tokenizer class=&quot;solr.StandardTokenizerFactory&quot; /&gt;<br />
		&lt;filter class=&quot;solr.StandardFilterFactory&quot; /&gt;<br />
	&lt;/analyzer&gt;<br />
&lt;/fieldType&gt;<br />

这个class属性指明一个工厂类,这个工厂类在需要的时候可以产生一个分词器的实例。分词器工厂类实现了 org.apache.solr.analysis.TokenizerFactory ,TokenizerFactory 的 create 方法接受一个 reader 然后返回一个 TokenStream。当 solr 创建了分词器,通过一个 reader 传递文本的字段内容给分词器。

可以通过设置 <tokenizer> 元素的属性给分词器传递参数。
<br />
&lt;fieldType name=&quot;semicolonDelimited&quot; class=&quot;solr.TextField&quot;&gt;<br />
	&lt;analyzer type=&quot;query&quot;&gt;<br />
		&lt;tokenizer class=&quot;solr.PatternTokenizerFactory&quot; pattern=&quot;; &quot; /&gt;<br />
		&lt;analyzer&gt;<br />
&lt;/fieldType&gt;<br />

添加一条评论 »本文共 3 条评论

Copyright © All Rights Reserved · Green Hope Theme by Sivan & schiy · Proudly powered by WordPress   闽ICP备18020075号-1