DIH 之数据源

数据源用于指定原始的数据和类型,数据源可以在实体处理类中指定,也可以在 solrconfig.xml 中指定。

可以自定义一个数据源,只要扩展自 org.apache.solr.handler.dataimport.DataSource 即可。
数据源定义中,名称和类型是必填的。
支持的数据源类型包括:
ContentStreamDataSource
FieldReaderDataSource
FileDataSource
JdbcDataSource
URLDataSource

full-import 参数

full-import 接受以下参数:
clean:
默认为true,告诉 Solr 在开始索引前是否情况已有索引
commit:
默认为true,告诉 Solr 操作完成后是否提交
debug:
默认为 false,设置该命令是否在调试模式下执行在,在调试模式下,文档不会自动提交,如果准备提交文档的话,需要带上 commit=true 这个 request 参数
entity:
用于指定配置文件中 <document> 标签下实体的名称,允许一次传多个entity名称,如果没有指定实体名称,所有的实体将被执行
optimize:
操作完成后是否优化索引,默认为true

document 和 field

document 是 solr 基本的信息单元,如果solr的索引库是一张数据库表的话,document 就是一条记录,field 表的字段,一个 document 由多个 field 构成。field 可以保存多种数据类型,就想数据库字段可以有各种类型:varchar、number等,一个 field 也有文本类型、字符串类型、浮点型,这些类型称之为 field type,这些 field type 就告诉 solr 怎么去索引和查询这个字段的数据。

Solr 构架

题目叫构架有点过了,不过想不到其他的,就先叫构架吧。假设要运行 Solr,首先需要一个 Solr 的 war 包,然后创建 SOLR_HOME。首先是启动 Solr 的 war 包,然后 solr 的 war 找到 SOLR_HOME ,根据里面的配置启动 solr,solr.war 和 SOLR_HOME 是分离的,这点和 eclipse 有点象,eclipse 是一个独立的平台,workspace 是一个个的配置实例。solr 也是这样的,Solr.war 是个平台,SOLR_HOME 是一个个的配置,这种分离的构建比较灵活了,切换配置和升级 solr.war 都比较方便,只要修改 solr.war 中 SOLR_HOME 的位置就行。

Copyright © All Rights Reserved · Green Hope Theme by Sivan & schiy · Proudly powered by WordPress   闽ICP备18020075号-1