首页 > 编程知识 正文

elasticsearch索引,elasticsearch介绍

时间:2023-05-05 02:59:39 阅读:126697 作者:4780

另一方面,Solr与Elasticsearch进行比较(如下所述,Solr体系结构不适合于实时搜索的应用) ) ) ) ) ) ) ) ) )。

1-简单搜索现有数据时,Solr更快

2-随着数据量的增加,Solr的搜索效率降低,但Elasticsearch没有大的变化

3-实时索引时,Solr产生io块,查询性能差,Elasticsearch具有明显的优势

二、Solr与Elasticsearch的比较总结(Solr是传统搜索APP应用的有力解决方案,而Elasticsearch适合新兴的实时搜索APP应用) ) )。

1-两者都很容易安装

2-Solr利用Zookeeper进行分散管理,但Elasticsearch本身具有分散协调管理功能

3-Solr支持更多格式的数据,而Elasticsearch仅支持json文件格式

4-Solr更多是官方提供的功能,Elasticsearch本身更注重核心功能,高级功能多由第三方插件提供;

5-Solr在传统的搜索APP应用中优于Elasticsearch,但在处理实时搜索APP应用时明显低于Elasticsearch的效率。

问题:是公司用的Solr还是ES? )

三、Solr个人资料(传统搜索,几年前) ) ) ) ) ) ) ) ) )。

读为1-solr(solar )。 是Apache Lucene项目的开源企业搜索平台。 其主要功能包括全文搜索、命中标记、面对面搜索、动态群集、数据库集成、Word和PDF等富文本处理。 Solr可扩展,提供分布式搜索和索引复制。 Solr是最流行的企业级搜索引擎,Solr4还添加了对NoSQL的支持。

2-Solr是一个以Java编写并在servlet容器(Tomcat或Jetty )中运行的独立全文服务器。

3-Solr采用以Lucene Java搜索库为中心的全文索引和搜索,具有类似REST的HTTP/XML和JSON的API。

4-Solr强大的外部配置功能使您可以调整以支持各种类型的APP应用程序,而无需Java编码。 Solr具有插件体系结构,可支持更高级的定制。

5—2010年Apache Lucene和Apache Solr项目合并。 Lucene/Solr或Solr/Lucene相同

6-好处:

(1) Solr有更大、更成熟的用户、开发人员和贡献者社区。

)2)支持添加多种格式的索引,包括HTML、PDF、Microsoftoffice系列软件格式,以及纯文本格式,如JSON、XML和CSV。

)3) Solr比较成熟、稳定。

)4)如果不考虑索引编制就进行检索,速度会更快。

7-缺点:

(1)索引编制时,检索效率低下,实时索引检索效率不高

四.电子搜索概述(可实时搜索分析。 这几年,很多公司的Solr变成了Elasticsearch ) ) )。

1-Elasticsearch是基于全文搜索引擎Apache Lucene构建的搜索引擎,可以说Lucene是当今最先进、最高效的全功能开源搜索引擎框架。 但是,Lucene只是一个框架,必须使用JAVA并将Lucene集成到程序中才能充分利用其功能。 了解它是如何工作的需要很多学习,Lucene确实非常复杂。

2-Elasticsearch使用Lucene作为内部引擎,但如果将其用于全文搜索,则无需了解其背后的复杂Lucene如何工作,只需使用统一开发的API即可。

3-当然,电子搜索不仅仅是Lucene。 除了全文搜索功能外,还提供以下任务:(1)分布式实时文件存储,以便在每个字段中创建索引和搜索

)2)可实时分析的分布式检索索引数

)3)可扩展到数百台服务器,处理Pb级结构化或非结构化数据。

所有这些功能都集成在一起,使您可以方便地用客户端和您喜欢的程序语言与ES的rest风格的API进行交流。

4-Elasticsearch的熟练程度非常简单,带有很多非常合理的默认值。 这样,初学者很快就能避免面对复杂的理论,安装后很快就可以使用了,用很小的学习成本就能变得非常有生产力。 可以灵活地配置整个引擎,并根据需要定制自己的Elasticsearch。

5-使用案例:

(1)维基百科使用Elasticsearch进行全文搜索,突出显示关键词,提供搜索- as-you-type等搜索建议功能。

)2) GitHub使用Elasticsearch搜索1300多亿行代码。

)3) Goldman Sachs每天都用它来处理5TB数据的索引,还有很多投资银行用它来分析股市波动。

)4) Elasticsearch不仅面向大型企业,还帮助许多创业公司(如DataDog和Klout )扩展功能。

6-好处:

(1) Elasticsearch分散。 不需要其他组件。 分发是实时的,称为“推送复制”。

)2) Elasticsearch完全支持Apache Lucene的接近实时搜索

(3)多租户处理)多租户

)不需要特殊配置,而Solr则需要更多的高级设置
(4)Elasticsearch 采用 Gateway 的概念,使得完备份更加简单
(5)各节点组成对等的网络结构,某些节点出现故障时会自动分配其他节点代替其进行工作。
7-缺点:
(1)还不够自动(不适合当前新的Index Warmup API)

五、Solr与Elasticsearch选择
1、Elasticsearch更容易上手,一个下载和一个命令就可以启动一切。
Solr传统上需要更多的工作和知识,但Solr最近在消除这一点上取得了巨大的进步,现在只需努力改变它的声誉。
2、Elasticsearch使用起来比较简单 – 它只有一个进程。
Solr在完全分布式部署模式SolrCloud中依赖于Apache ZooKeeper
3、如果除了搜索文本之外还需要它来处理分析查询,Elasticsearch是更好的选择
4、如果需要分布式索引,则需要选择Elasticsearch
5、如果您喜欢监控和指标,那么使用Elasticsearch,您将会进入天堂
6、Elasticsearch内置了类似ZooKeeper的组件Xen,但ZooKeeper可以更好地防止有时在Elasticsearch集群中出现的可怕的裂脑问题。 Elasticsearch开发人员已经意识到这个问题,并致力于改进Elasticsearch的这个方面。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。