Questions tagged «elasticsearch»

Elasticsearch是基于Lucene的开源(Apache 2)分布式RESTful搜索引擎。



3
如何在GitHub代码搜索中转义字符?
我试图使用GitHub的代码搜索来搜索包含字符代码,像一些行=,+等 我从https://help.github.com/articles/searching-code/#considerations-for-code-search了解到,这些字符是通配符,必须转义,否则将被忽略。 这是一个示例:“ if \(done is True \)”和另一个:“ if(done is True)”。 两者都"your query contains a character that is ignored"在搜索栏的右侧返回相同的警告。我的转义似乎没有做任何事情,并且得到的结果是忽略了字符。

7
正确的Amazon Elastic Search Cluster访问策略
我最近开始使用新的Amazon Elasticsearch Service,但似乎无法弄清楚我需要的访问策略,这样我只能从分配了特定IAM角色的EC2实例中访问服务。 这是我当前为ES域分配的访问策略的示例: { "Version": "2012-10-17", "Statement": [ { "Sid": "", "Effect": "Allow", "Principal": { "AWS": [ "arn:aws:iam::[ACCOUNT_ID]:role/my_es_role", ] }, "Action": "es:*", "Resource": "arn:aws:es:us-east-1:[ACCOUNT_ID]:domain/[ES_DOMAIN]/*" } ] } 但是正如我所说,这是行不通的。我登录到EC2实例(具有my_es_role附加的角色)并尝试在“ https://*.es.amazonaws.com”端点上运行简单的curl调用,出现以下错误: {“消息”:“用户:匿名者无权执行:es:ESHttp获取资源:arn:aws:es:us-east-1:[ACCOUNT_ID]:domain / [ES_DOMAIN] /”} 有人知道我必须更改访问策略才能使其正常工作吗?

11
如何更改Elasticsearch最大内存大小
我有一台默认配置为Elasticsearch的Apache服务器,除默认配置的最大大小为1GB之外,其他一切工作正常。 我没有太多的文档要存储在Elasticsearch中,因此我想减少内存。 我已经看到我必须-Xmx在Java配置中更改参数,但是我不知道如何。 我已经看到可以执行此操作: bin/ElasticSearch -Xmx=2G -Xms=2G 但是,当我必须重新启动Elasticsearch时,它将丢失。 将Elasticsearch作为服务安装时,是否可以更改最大内存使用量?

11
如何在Elasticsearch 2.0中启用远程访问/请求?
从v2.0开始,Elasticsearch默认情况下仅在localhost上侦听,但我想在localhost之外发出请求。 例如,允许这样的请求: http://localhost:9200/ 但这不是: http://server_name:9200/ (从服务器外部,例如:同一LAN中的本地计算机)。 谢谢你的帮助。

3
如何使用Logstash处理多个异构输入?
假设您有两种非常不同的日志类型,例如技术日志和业务日志,并且您想要: 使用gelf输出将原始技术日志路由到graylog2服务器, json业务日志使用专用elasticsearch_http输出存储到Elasticsearch集群中。 我知道,Syslog-NG例如,配置文件允许定义几个不同的输入,然后可以在分派输入之前对其进行单独处理。什么Logstash似乎无法做到。即使可以使用两个特定的配置文件启动一个实例,所有日志都使用相同的通道并被应用相同的处理... 是否应该运行与具有不同类型的日志一样多的实例?

11
如何将Elasticsearch数据从一台服务器移动到另一台服务器
如何将Elasticsearch数据从一台服务器移动到另一台服务器? 我有一个服务器A在具有多个索引的一个本地节点上运行Elasticsearch 1.1.1。我想将该数据复制到运行Elasticsearch 1.3.4的服务器B 到目前为止的程序 关闭两台服务器上的ES 将所有数据都保存到新服务器上的正确数据目录中。(数据似乎位于我的Debian盒子上的/ var / lib / elasticsearch /中) 将权限和所有权更改为elasticsearch:elasticsearch 启动新的ES服务器 当我用ES head插件查看集群时,没有索引出现。 似乎未加载数据。我想念什么吗?

5
Redis与RabbitMQ作为Logstash和Elasticsearch之间的数据代理/消息传递系统
我们正在定义一种架构,以通过安装在各种计算机上的Logstash托运人收集日志信息,并在一个Elasticsearch服务器中集中索引数据并将Kibana用作图形层。我们需要在Logstash托运人和elasticsearch之间建立可靠的消息传递系统,以使交付受托。在Logstash托运人和elasticsearch之间选择Redis over RabbitMQ作为数据代理/消息传递系统时应考虑哪些因素?反之亦然?

13
将JSON文件导入/索引到Elasticsearch中
我是Elasticsearch的新手,到目前为止一直在手动输入数据。例如,我已经做了这样的事情: $ curl -XPUT 'http://localhost:9200/twitter/tweet/1' -d '{ "user" : "kimchy", "post_date" : "2009-11-15T14:12:12", "message" : "trying out Elastic Search" }' 我现在有一个.json文件,我想将其索引到Elasticsearch中。我也尝试过类似的方法,但没有成功: curl -XPOST 'http://jfblouvmlxecs01:9200/test/test/1' -d lane.json 如何导入.json文件?我需要首先采取一些步骤来确保映射正确吗?

7
Elasticsearch 2.1:“结果”窗口太大(index.max_result_window)
我们从Elasticsearch 2.1检索信息,并允许用户翻阅结果。当用户请求较高的页码时,我们会收到以下错误消息: 结果窗口太大,从+大小必须小于或等于:[10000],但为[10020]。请参阅滚动API,以获取请求大型数据集的更有效方法。可以通过更改[index.max_result_window]索引级别参数来设置此限制 弹性文档表示,这是因为内存消耗高,并且要使用滚动api: 大于的值会在每次搜索和执行搜索的每个分片上消耗大量的堆内存。保留此值是最安全的,因为它是任何深度滚动使用滚动API的https://www.elastic.co/guide/zh-cn/elasticsearch/reference/2.x/breaking_21_search_changes.html#_from_size_limits 问题是我不想检索大型数据集。我只想从数据集中检索一个切片,该切片在结果集中很高。滚动文档也说: 滚动不适用于实时用户请求https://www.elastic.co/guide/en/elasticsearch/reference/2.2/search-request-scroll.html 这给我一些问题: 1)如果我使用滚动api向上滚动到结果10020(而不考虑低于10000的所有内容),而不是对结果10000-10020进行“正常”搜索请求,则内存消耗是否会真正降低(如果有,为什么)? 2)滚动API似乎不是我的选择,但我必须增加“ index.max_result_window”。有人对这个有经验么? 3)还有其他选择可以解决我的问题吗?


9
Elasticsearch的连接超时
from datetime import datetime from elasticsearch import Elasticsearch es = Elasticsearch() doc = { 'author': 'kimchy', 'text': 'Elasticsearch: cool. bonsai cool.', 'timestamp': datetime(2010, 10, 10, 10, 10, 10) } res = es.index(index="test-index", doc_type='tweet', id=1, body=doc) print(res['created']) 这个简单的代码返回以下错误: elasticsearch.exceptions.ConnectionTimeout: ConnectionTimeout caused by - ReadTimeoutError(HTTPConnectionPool(host='localhost', port=9200): Read timed out. (read timeout=10)) 非常奇怪,因为服务器已准备就绪并已设置(http:// …

4
如何建立ES集群?
假设我要在5台计算机上运行Elasticsearch集群,并且它们都连接到共享驱动器。我将Elasticsearch的单个副本放在该共享驱动器上,以便所有三个都可以看到它。我是否只是在所有机器上的共享驱动器上启动Elasticsearch,集群便会自动发挥作用?还是我必须配置特定设置以使Elasticsearch意识到它可以在5台计算机上运行?如果是这样,相关的设置是什么?我应该担心配置副本还是会自动处理?

5
Elasticsearch:根映射定义具有不受支持的参数索引:not_analyzed
大家好,我正在尝试创建架构测试。 PUT /test { "mappings": { "field1": { "type": "integer" }, "field2": { "type": "integer" }, "field3": { "type": "string", "index": "not_analyzed" }, "field4": { "type": "string", "analyzer": "autocomplete", "search_analyzer": "standard" } }, "settings": { bla bla bla } } 我收到以下错误 { "error": { "root_cause": [{ "type": "mapper_parsing_exception", "reason": "Root …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.