- distributed document store
- zoek en analyse engine
- kan schema loos
Doel: zo goed als real time zoeken en analyseren ingrote hoeveelheden gestructureerde en ongestructureerde data
JSON documenten
In cluster?
- opgeslagen documenten worden verdeeld over verschillende nodes (distributed)
Maakt gebruik van inverted index dat zorgt voor snel full text zoeken
- Inverted index: een index van woorden en waar ze voorkomen in de documenten
Index -> geoptimaliseerde collectie van documenten
Default: Alle data en elke veld wordt geïndexeerd en heeft een eigen gedediceerde inverted index
For example, text fields are stored in inverted indices, and numeric and geo
fields are stored in BKD trees. The ability to use the per-field data
structures to assemble and return search results is what makes
Elasticsearch so fast.
_In the CAP theorem, Elasticsearch falls into the AP category of the CAP
theorem, which prioritizes availability and partition tolerance over
consistency. In other words, in the event of a network partition or node
failure, Elasticsearch will prioritize returning results quickly and ensuring
that the system remains available over providing strong consistency
guarantees. However, Elasticsearch still ensures eventual consistency,
meaning that updates to data are eventually propagated to all nodes in the
cluster._
ELK stack (Elasticsearch, Logstash, Kibana)
-
Real time seach and analytics at scale
-
UI: Kibana
-
Opslaan, indexeren en analyseren: Elasticsearch
-
Ingest van data: Logstash of Beats
-
Niew iets maken
POST books/_doc {"name": "Snow Crash", "author": "Neal Stephenson", "release_date": "1992-06-01", "page_count": 470}
-
Zoek alle documenten van iets
GET books/_search
-
Zoek iets specifiek
GET books/_search {"query": {"match": {"name": "Snow Crash"}}}
Tot iedereens grootste verbazing: ZOEKEN
Goed als zoekoperaties, ophalen en raportering belangrijk zijn
- Logging in applicaties
- E-commerce
- Security events (SIEM) -> Security Information and Event Management
- ELK stack
- Opensearch / Wazuh
- 100% open-source search and analytics suite used for a broad set of use cases like real-time application monitoring, log analytics, and website search.
- Wazuh open-source security analytics platform
Oorspronkelijk Apache licentie(permissive open source license), maar Elastic NV heeft de licentie aangepast naar SSPL (Server Side Public License). Deze licentie legt restricties op aan cloud providers. (Deze licentie is gelijk aan die van mongoDB)
Elasticsearch geforked door Amazon Web Services (AWS) en hernoemd naar OpenSearch. Dit omdat Elastic NV de licentie had zitten aanpassen.
Bla bla bla cool cool