facet.field 参数

该参数用于指定需要进行层面搜索的字段, ugg outlet france 可值可以多次设置, puma sneakers 这样可以对多个字段进行层面搜索。

curl 工具

以后章节中的许多例子会用到 curl 这个工具来通过 URL 发送数据给 Solr 索引库。 puma pas cher curl 通过 HTTP、FTP 等其他协议来发送和接收数据。 timberland boots homme 大部分的 Linux 发行版中包含了一个 curl。 bottes ugg pas cher 在网上(curl 的官网可能需要翻墙才能打开)可以用下载到 Linux、Windows 和其他操作系统版本的 curl 工具 ,

Solr Example 目录

在 Solr 发行包中, doudoune moncler soldes 有一个 example 目录, ugg boots 这个目录中包含一个 Solr 运行实例, doudoune moncler homme 和上传到索引库所用的实例文档。 soldes puma 实例文档在 solr_home /example/exampledocs 中找到。

什么是索引

索引是指添加内容到 Solr 的索引库,必要的时候,会修改或删除索引库中的数据,通过将数据加入索引库,我们就可以通过 solr 搜索这些数据。 puma 2018 pas cher

Solr 索引库可以接受多种类型的数据源,包括 xml 文件,CSV 文件,从数据表中提出出来的数据,类似Word 和 PDF 这些常见的文档。
这里有三个常见往索引库添加数据的方式:
  • 使用构建在 Apache Tika 之上的 Solr Cell,Tika 可以提取二进制文件或者像 Office、Pdf 这样的结构化文件。 puma pas cher
  • 通过 HTTP 方式,将 XML 文件上传给 Solr 服务器。 moncler pas cher
  • 写一个 Java 程序,通过 Solr 的 Java 客户端 API 。 Achat chaussure Puma 在应用程序中,使用 Java API 提交数据可能是最好的方式。 ugg france

不管通过什么方式来抽取数据,但是往 Solr 索引库送数据有一个基本数据结构:document,一个document包含多个字段,每个字段包含一个名称和数据,数据有可能为空。 magasin uggs pas cher 其中的一个字段通常会被设置成唯一ID字段,尽管这个唯一ID字段在 Solr 中不是必须的。 timberland pas cher

如果字段名称在 schema.xml 文件中有定义,在分析阶段,字段的内容将会按配置中的说明进行处理,如果字段名称在 schema.xml 没有明确定义,将去动态字段中匹配该字段。

想法占位

Solr cache sizes should be tuned to the number of documents in the
index, doudoune moncler homme the queries, Timberland Homme and the number of results you usually get from Solr.
我想, bottes ugg pas cher 我应该做一个自动调整缓存的功能。 chaussures puma 先占个位, ugg pas cher 等全面了解完 solr 后再行实行。

层面搜索参数

层面搜索主要有以下两个参数:
facet
值为 true 或空, chaussures puma pas cher 默认为空, soldes puma chaussure 为 true 时,将启动层面搜索, moncler 该值为 true 时, timberland homme facet.query 参数才有效。
facet.query
该参数允许指定任意 Lucene 查询,默认情况下, timberland solr 自动返回一个字段分类统计的结果。该参数特别适用于数值的范围或者前缀的层面搜索。

Solr自带分词器,过滤器,语言分析

占位

接下来本来应该讲解 Solr 自带的分词器、过滤器和语言分析, ugg outlet france 鉴于这一部分内容多而繁琐, ugg femme 很多在中文处理中用不到, basket timberland 暂时先略过, bottes ugg 以后有时间补上。

层面搜索(Faceting)

层面搜索是 Solr 的一个重要特性, moncler paris 是对搜索结果按某些字段进行分组统计, chaussures puma 2018 pas cher 类似 SQL 中的 group by。在电子商务网站中, timberland chaussures 经常会见到, timberland pas cher 效果如下所示:
上图是在淘宝中搜索 710 关键字得到的结果, bottes ugg soldes 大概意思是在淘宝中,男装中含710关键字的有 2047 个, puma 2018 pas cher 运动鞋中含 710 关键字的有 2891 个。

Java-based 实现的索引复制

solr 包含一个基于 Java-based 实现的索引复制, doudoune femme moncler pas cher 通过http方式完成。 chaussures puma
这个方式的索引复制具有以下几点好处:
  • 不需要额外的脚本
  • 可以通过 solrconfig.xml 控制索引的复制
  • 可以同步配置文件和索引文件
  • 跨平台
  • 没有依赖于平台的硬编码链接
  • 和其他的 RequestHandler 一样,

索引复制(Index Replication)

索引复制这种分布式方式, bottes ugg 是由一个主索引和多个从索引构成, ugg soldes 从索引从主索引复制索引。 moncler soldes 主索引负责更新索引, timberland sitemap 从索引复制同步索引和查询。 puma pas cher 一个主索引可以复制索引到多个多个从索引库。

Copyright © All Rights Reserved · Green Hope Theme by Sivan & schiy · Proudly powered by WordPress · 闽ICP备18020075号