关于我

哥是一个普通 Java 程序员,08年开始投身IT行业,在一个不算大的城市的一家不算大的公司从事软件开发。大约09年的时候开始触 apache solr 这个企业级的开源的搜索服务器,然后陆陆续续(不大的公司,很多时候会要求员工是个全才,不太可能专心研究某个产品)有些使用,在使用过程中,发现 solr 和其他很多开源软件一样,在互联网中,只能搜到几篇原创的入门级文章,剩下的全是不保留出处地转载来转载去的,这些资料里,很多因为长时间未更正,会出现一些纰漏,转载的同学也没有经过自己的验证就全文复制。总的来说,关于 solr 的中文资料非常匮乏,而 solr 是一个非常优秀的搜索服务器,如果要做企业级搜索,将是一个不错的选择。同时,光靠网上现有的资料,不能很好的运用 solr ,所以,我就尝试弄这么个 Solr 中文网 出来,分享一些 solr 使用的方式,希望对准备做搜索或使用 solr 的同行有所帮助。

联系方式:

邮箱 lindent@qq.com

交流群 Solr交流群,请注明solr,要不可能被其他管理员拒绝。

    • 官方应该是没有提供json数据的dih导入方法,其实不是非常建议使用dih,虽然dih比较方便,不过,它不够灵活,也没有处理大数据量,容易内存溢出,不如自己读取数据再写索引来的好

      • 但我这里都是千万级起跳的数据,一段一段post实在太慢了,DIH效率比较高啊
        我改JSON为xml了,但还在努力研究中

        • 你用 solrj 吗?如果用 solrj 的话可以这么做,通过 gson 将 json 数据转成 java bean,然后将 bean 的值塞入 document ,提交给 solr 索引,这样也很快,而且使用 java,可以进行很多的处理,千万数据应该几个小时就能搞定。

  1. 请教
    solr DIH 可以以一个命令的输出作为输入数据源吗?
    如果以本地文件为输入,怎么做delta-import呢?

  2. 公司使用solr,我自己没有java基础,但是跟着公司前人的帮助和一些文档,可以部署一下,完成solr的一些基本功能.但是我现在想更深入,随着数量级的增加,公司solr也经常出现一些异常,很是茫然.不知道该如何下手,想问问有什么建议或者方向

  3. Pingback: 新栏目上线:译书 | Solr 中文网

  4. 有个问题请教下:solrcloud配置完成后如何设置对外的统一端口。如4个share端口为8983,8984,8993,8994,2个分片2个副本,外部访问8983,若8983挂了,8983无法访问,但是整个solrcloud是正常运行的,请问我该怎么设置统一的对外访问端口?

  5. 楼主,你好。请教一个问题。
    solrCloud是否支持一个索引目录下。有多个索引文件。
    例如:/data/a 索引目录。下面有b,c,d,等等索引文件
    谢谢

Copyright © All Rights Reserved · Green Hope Theme by Sivan & schiy · Proudly powered by WordPress