关于我

哥是一个普通 Java 程序员,08年开始投身IT行业,在一个不算大的城市的一家不算大的公司从事软件开发。大约09年的时候开始触 apache solr 这个企业级的开源的搜索服务器,然后陆陆续续(不大的公司,很多时候会要求员工是个全才,不太可能专心研究某个产品)有些使用,在使用过程中,发现 solr 和其他很多开源软件一样,在互联网中,只能搜到几篇原创的入门级文章,剩下的全是不保留出处地转载来转载去的,这些资料里,很多因为长时间未更正,会出现一些纰漏,转载的同学也没有经过自己的验证就全文复制。总的来说,关于 solr 的中文资料非常匮乏,而 solr 是一个非常优秀的搜索服务器,如果要做企业级搜索,将是一个不错的选择。同时,光靠网上现有的资料,不能很好的运用 solr ,所以,我就尝试弄这么个 Solr 中文网 出来,分享一些 solr 使用的方式,希望对准备做搜索或使用 solr 的同行有所帮助。

联系方式:

邮箱 lindent@qq.com

交流群 Solr交流群,请注明solr,要不可能被其他管理员拒绝。

添加一条评论 »本文共 26 条评论

  1. 请问有没有做SOLR的公司介绍给我?

  2. 我正在找开发员.
    有兴趣请电邮我
    writensend@hotmail.com

  3. 请教怎样用DIH导入JSON/BSON格式数据

    • 官方应该是没有提供json数据的dih导入方法,其实不是非常建议使用dih,虽然dih比较方便,不过,它不够灵活,也没有处理大数据量,容易内存溢出,不如自己读取数据再写索引来的好

      • 但我这里都是千万级起跳的数据,一段一段post实在太慢了,DIH效率比较高啊
        我改JSON为xml了,但还在努力研究中

        • 你用 solrj 吗?如果用 solrj 的话可以这么做,通过 gson 将 json 数据转成 java bean,然后将 bean 的值塞入 document ,提交给 solr 索引,这样也很快,而且使用 java,可以进行很多的处理,千万数据应该几个小时就能搞定。

          • 立刻去了解,我的数据源是cassandra的用DIH本来就麻烦,我先看看资料再来交流

          • 每小时100万行数据,xml格式,solrPhp

  4. 请教
    solr DIH 可以以一个命令的输出作为输入数据源吗?
    如果以本地文件为输入,怎么做delta-import呢?

    • 不太清楚,因为我个人不主张使用DIH,DIH不如直接用客户端来的灵活

      • 两个效率差蛮大的,我继续研究dih吧,省掉不少io和cpu的,用得好至少省1/3

  5. 建议教程里增加原文wiki链接

    • 还没开始翻译 wiki,等翻译 wiki 的时候会放链接,这个是一本电子书的章节

  6. 大数据量,用DIH,为什么不选择用数据库?

  7. 公司使用solr,我自己没有java基础,但是跟着公司前人的帮助和一些文档,可以部署一下,完成solr的一些基本功能.但是我现在想更深入,随着数量级的增加,公司solr也经常出现一些异常,很是茫然.不知道该如何下手,想问问有什么建议或者方向

    • 你可以看看 elasticsearch 据说他更适合大数据量

      • elasticsearch 做过测试,在百万级数据下,性能比solr差多了

        • 那千万以上呢? solr 因为缓存做的非常好,数据少的话,性能非常高的

  8. 新栏目上线:译书 | Solr 中文网
  9. 楼主辛苦了,用一个下午读完你的教程,很受益,感谢!

  10. 有个问题请教下:solrcloud配置完成后如何设置对外的统一端口。如4个share端口为8983,8984,8993,8994,2个分片2个副本,外部访问8983,若8983挂了,8983无法访问,但是整个solrcloud是正常运行的,请问我该怎么设置统一的对外访问端口?

  11. 楼主,你好。请教一个问题。
    solrCloud是否支持一个索引目录下。有多个索引文件。
    例如:/data/a 索引目录。下面有b,c,d,等等索引文件
    谢谢

  12. 楼主,你好,请问下solrClouod如何配置多个schema.xml。

Copyright © All Rights Reserved · Green Hope Theme by Sivan & schiy · Proudly powered by WordPress