阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

统计Elasticsearch中月每天索引量的脚本

131次阅读
没有评论

共计 3103 个字符,预计需要花费 8 分钟才能阅读完成。

随着业务量的不断上升,最近一段时间需要对生产环境中的 elasticsearch 集群中的历史索引数据做迁移,而在做迁移前需要对被迁移的 elasticsearch 索引数据做统计用于迁移后的验证统计,所以就写了一个脚本用于 es 数据中查询历史索引的量生成报表文件,而在其中有使用过 jq 工具用于取数,jq 的介绍可以见本文最后。

#!/bin/bash
#es_count_report.sh
#used for elasticsearch monthly numbers index
#you must install jq and curl
#writer jim
#2017.09.19
#Position parameter judgment
datetime=$(date +”%Y%m”)
 
if [$# -lt 1];then
    echo “Please enter the date ‘year month'”
    echo “ex> $0 ${datetime}”
    exit 1
fi
 
if [$# -gt 1]; then
        echo “The input host address are too much”
    echo “ex> $0 ${datetime}”
    exit 1
fi
# 这里在 elasticsearch 中取数时有用到 curl 和 jq
rpm -qa | grep jq && rpm -qa | grep curl
if [$? -ne 0];then
    yum -y install jq curl
fi
 
es_ip=”192.168.2.200″
es_port=”9200″
monthtime=$1
#elasticsearch 的相关信息及传入的时间
data_index=”data-${monthtime}”
index_name_all=$(curl -s “http://${es_ip}:${es_port}/_cat/indices?v” | grep ${data_index} | awk ‘{print $3}’ | sort)
report_file=”$(pwd)/index_num_”${monthtime}”.txt”
cat /dev/null > $report_file
# 至空生成一个新文件用于记录
for i in $index_name_all
do
    index_num=$(curl -s -XGET “http://${es_ip}:${es_port}/${i}/poll/_search/?pretty” -d ‘{“_source”:true,”size”: 0}’|jq ‘.hits.total’) && echo “$i:$index_num” >> $report_file
done

总之在平时可以根据 elasticsearch 的 api 接口实现各种不同的数据统计

jq : Linux 下 json 的命令行工具

 JSON 是前端编程经常用到的格式,对于 PHP 或者 Python,解析 JSON 都不是什么大事,尤其是 PHP 的 json_encode 和 json_decode, 干的相当的漂亮。Linux 下也有处理处理 JSON 的神器:jq。
   对于 JSON 格式而言,jq 就像 sed/awk/grep 这些神器一样的方便,而也,jq 没有乱七八糟的依赖,只需要一个 binary 文件 jq,就足矣。下面我们看下 jq 的使用。
   1 格式化 JSON 

 

  1. manu@manu:~/code/php/json$ cat json_raw.txt 

  2. {“name”:“Google”,“location”:{“street”:“1600 Amphitheatre Parkway”,“city”:“Mountain View”,“state”:“California”,“country”:“US”},“employees”:[{“name”:“Michael”,“division”:“Engineering”},{“name”:“Laura”,“division”:“HR”},{“name”:“Elise”,“division”:“Marketing”}]}

   上面的 JSON 是 PHP json_encode 之后,echo 出来的字符串,很明显,可读性太差。前一阵子写文档,需要将前后段 JSON 写入文档,我当时是用是网上的 JSON 格式化工具做的。事实上,jq 就可以检查 JSON 的合法性,并把 JSON 格式化成更友好更可读的格式:

 

  1.     cat json_raw.txt | jq .

   

   看到上图,将一团乱麻的 JSON 格式化成个更可读的形式。其实背后另外检查了 JSON 的合法性。如果 JSON 不合法,jq . 会报错。我故意写个错误的 JSON:

 

  1. manu@manu:~/code/php/json$ cat json_err.txt

  2. {“name”:“Google”,“location”:{“street”:“1600 Amphitheatre Parkway”,“city”:“Mountain View”,“state”:“California”,“country”:“US”},“employees”:[{“name”:“Michael”,“division”:“Engineering”}{“name”:“Laura”,“division”:“HR”},{“name”:“Elise”,“division”:“Marketing”}]}

   上面 JSON 中加粗和斜体部分,遗漏了一个逗号,所以这个 JSON 是错误的,jq 轻松的可以轻松的检查出来:

 

  1.     manu@manu:~/code/php/json$ cat json_err.txt |jq .

  2.     parse error: Expected separator between values at line 1, column 183

    2 JSON parse
   如上图 json,jq 如何解析 JSON,根据 key 获取 value?

 

  1.     {

  2. “key_1”:“value_1”,

  3. “key_2”:“value_2”,

  4.     }

    如何根据 key 获取 value?

 

  1.     jq ‘.key’

    统计 Elasticsearch 中月每天索引量的脚本
   解析不存在的元素,会返回 null

 

  1.     echo ‘{“foo”: 42, “bar”: “less interesting data”}’ | jq .nofoo

  2.     null

   3 JSON nested parse(嵌套解析)

 

    cat json_raw.txt | jq ‘.location.state’

    “California”

   4 JSON parse array   

 

    cat json_raw.txt | jq ‘.employees[1].name’

    “Laura”

   5 内建函数
 
jq 还有一些内建函数如 key,has
  key 是用来获取 JSON 中的 key 元素的:

 

  1. cat json_raw.txt | jq ‘keys’

  2. [

  3.   “employees”,

  4.   “location”,

  5.   “name”

  6. ]

   has 是用来是判断是否存在某个 key:

 

  1. cat json_raw.txt | jq ‘has(“name”)’

  2. true

  3.  

  4. cat json_raw.txt | jq ‘has(“noexisted”)’

  5. false

   与 JSON 相关的我就暂时介绍到这

基于 CentOS 6.9 搭建 ELK 环境指南  http://www.linuxidc.com/Linux/2017-07/145636.htm

Linux 日志分析 ELK 环境搭建  http://www.linuxidc.com/Linux/2017-07/145494.htm

本文永久更新链接地址 :http://www.linuxidc.com/Linux/2017-09/147002.htm

正文完
星哥说事-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2022-01-21发表,共计3103字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中