
Elasticsearch作为一个分布式、高扩展、实时的搜索与数据分析引擎,因其轻量级、稳定、可靠、快速等特性受到越来越多开发者的青睐,在搜索、日志分析、运维监控和安全分析等领域得到广泛应用。阿里云Elasticsearch技术团队,深度采访了来自阿里巴巴、vivo、携程、eBay等知名公司的技术专家,推出了Elasticsearch大咖说系列专题,为广大开发者提供技术入门与进阶的经验分享,以及最佳应用实践参考。

分享嘉宾
朱杰
Elastic 资深技术顾问
Elastic成立于2012年,并在2018年于纽约证券交易所上市,是一家数据搜索技术提供商。其提供的技术使用户能够在广泛的消费者和企业应用程序中搜索大量结构化和非结构化数据,并进行分析和可视化。
/ 1 /
Elasticsearch从全文搜索引擎演进成为通用搜索引擎经历了8年多的时间,最早期的时候,Elasticsearch只是一个反向索引,无法实现指标分析等功能,在进行聚合时也会面临性能问题。在后来的演进中增加了列存储,这对于排序和聚合产生了巨大影响,不仅加快了执行速度,还降低了资源消耗。仅仅有这些还远远不够,在2014年的时候,Elasticsearch推出了聚合框架,此时它能够用于代替很多SQL分析场景。在2016年,Elasticsearch增加了BDK树并且做了稀疏数据的优化,为数字搜索优化了数据结构,加快了分析,并且降低了存储空间。在2018年的时候,Elasticsearch加入了数据上卷特性,将时序性数据聚合到大的时间框内,能够节省磁盘空间。经过这么多年的演进,Elasticsearch从全文搜索引擎变成了通用的搜索引擎。
/ 2 /
Elasticsearch的查询能力目前在业界处于领先地位。用户可以将精确查询、全文查询以及地理位置的查询写到一条语句里面进行查询,之后还可以进一步进行聚合计算。正是因为强大的查询能力,Elasticsearch的应用场景空前繁荣,能够看到最多的是代替了很多数据库查询的加速层,其次还用于用户画像、聚合报表、订单查询以及大数据风控等。
/ 3 /
Elastic的机器学习能力目前已经赋能到所提供的各种应用之中,比如APM、业务分析、日志、指标、安全等。无监督的好处在于不需要人工去标注数据,计算和判断的执行速度都会快很多。在Elasticsearch 7.2版本和7.3版本中,推出Data Fram功能,能够将原始数据的索引经过转换聚合到另外一个更加适合分析的索引中,为后续的机器学习提供了更多的能力。未来,Elasticsearch也可能提供有监督的机器学习能力。
/ 4 /
目前,Beats的生态非常活跃,广大开发者也可以将自己新的想法提交到 Beats生态中,让更多的人来使用。作为老牌插件的Logstash仍然在持续发展当中,未来,Logstash倾向于成为做数据转化和清洗的中间件。无论是对于Logstash还是Beats而言,都需要进行集中管理,后续版本中也会提供更多这一方面的能力。
/ 5 /
Kibana的平台化战略会是未来的发展方向,首先Kibana会变成一个可视化分析平台,这也是目前已经实现的功能。此外,Kibana还会演变成一个解决方案的平台,使得用户能够基于Kibana构建各种各样的行业解决方案。最后,Kibana还会成为运维平台,能够监控各种各样的业务指标。
/ 6 /
拥抱Kubernetes是必然趋势。社区中也有大量的Elastic Stack运行在Kubernetes之上,因此作为Elastic公司而言,提供Kubernetes的能力是最为合适的。Elastic的ECK目前提供了管理和监控集群、方便升级新版本、弹性伸缩以及定时备份的能力,未来将会进一步拥抱Kubernetes生态,期待ECK的进一步发展。
END








