EFK
插件是k8s
项目的一个日志解决方案,它包括三个组件:Elasticsearch, Fluentd, Kibana;Elasticsearch 是日志存储和日志搜索引擎,Fluentd 负责把k8s
集群的日志发送给 Elasticsearch, Kibana 则是可视化界面查看和检索存储在 Elasticsearch 的数据。
下载官方最新release,进入目录: kubernetes/cluster/addons/fluentd-elasticsearch
,参考官方配置的基础上使用本项目manifests/efk/
部署,以下为几点主要的修改:
- 官方提供的
kibana-deployment.yaml
中的参数SERVER_BASEPATH
在k8s v1.8 版本以后部署需要按照本项目调整 - 修改官方docker镜像,方便国内下载加速
$ kubectl create -f /etc/ansible/manifests/efk/
$ kubectl create -f /etc/ansible/manifests/efk/es-without-pv/
注意:Fluentd 是以 DaemonSet 形式运行且只会调度到有beta.kubernetes.io/fluentd-ds-ready=true
标签的节点,所以对需要收集日志的节点逐个打上标签:
$ kubectl label nodes 192.168.1.2 beta.kubernetes.io/fluentd-ds-ready=true
node "192.168.1.2" labeled
kubectl get pods -n kube-system|grep -E 'elasticsearch|fluentd|kibana'
elasticsearch-logging-0 1/1 Running 0 19h
elasticsearch-logging-1 1/1 Running 0 19h
fluentd-es-v2.0.2-6c95c 1/1 Running 0 17h
fluentd-es-v2.0.2-f2xh8 1/1 Running 0 8h
fluentd-es-v2.0.2-pv5q5 1/1 Running 0 8h
kibana-logging-d5cffd7c6-9lz2p 1/1 Running 0 1m
kibana Pod 第一次启动时会用较长时间(10-20分钟)来优化和 Cache 状态页面,可以查看 Pod 的日志观察进度,如下等待 Ready
状态
$ kubectl logs -n kube-system kibana-logging-d5cffd7c6-9lz2p -f
...
{"type":"log","@timestamp":"2018-03-13T07:33:00Z","tags":["listening","info"],"pid":1,"message":"Server running at http://0:5601"}
{"type":"log","@timestamp":"2018-03-13T07:33:00Z","tags":["status","ui settings","info"],"pid":1,"state":"green","message":"Status changed from uninitialized to green - Ready","prevState":"uninitialized","prevMsg":"uninitialized"}
这里介绍 kube-apiserver
方式访问,获取访问 URL
$ kubectl cluster-info | grep Kibana
Kibana is running at https://192.168.1.10:8443/api/v1/namespaces/kube-system/services/kibana-logging/proxy
浏览器访问 URL:https://192.168.1.10:8443/api/v1/namespaces/kube-system/services/kibana-logging/proxy
,然后使用basic auth(参照hosts文件设置,默认:用户admin 密码test1234)
或者证书
的方式认证后即可,关于认证可以参考dashboard文档
首次登陆需要在Management
- Index Patterns
创建 index pattern
,可以使用默认的 logstash-* pattern,点击 Create; 创建Index后,稍等几分钟就可以在 Discover 菜单看到 ElasticSearch logging 中汇聚的日志;
日志数据是存放于 Elasticsearch POD
中,但是默认情况下它使用的是emptyDir
存储类型,所以当 POD
被删除或重新调度时,日志数据也就丢失了。以下讲解使用NFS
服务器手动(静态)创建PV
持久化保存日志数据的例子。
- 准备一个nfs服务器,如果没有可以参考nfs-server创建。
- 配置nfs服务器的共享目录,即修改
/etc/exports
(根据实际网段替换192.168.1.*
),修改后重启systemctl restart nfs-server
。
/share 192.168.1.*(rw,sync,insecure,no_subtree_check,no_root_squash)
/share/es0 192.168.1.*(rw,sync,insecure,no_subtree_check,no_root_squash)
/share/es1 192.168.1.*(rw,sync,insecure,no_subtree_check,no_root_squash)
/share/es2 192.168.1.*(rw,sync,insecure,no_subtree_check,no_root_squash)
- 请按实际日志容量需求修改
es-static-pv/es-statefulset.yaml
文件中 volumeClaimTemplates 设置的 storage: 4Gi 大小 - 请根据实际nfs服务器地址、共享目录、容量大小修改
es-static-pv/es-pv*.yaml
文件中对应的设置
# 如果之前已经安装了默认的EFK,请用以下两个命令先删除它
$ kubectl delete -f /etc/ansible/manifests/efk/
$ kubectl delete -f /etc/ansible/manifests/efk/es-without-pv/
# 安装静态PV 的 EFK
$ kubectl create -f /etc/ansible/manifests/efk/
$ kubectl create -f /etc/ansible/manifests/efk/es-static-pv/
- 目录
es-static-pv
下首先是利用 NFS服务预定义了三个 PV资源,然后在es-statefulset.yaml
定义中使用volumeClaimTemplates
去匹配使用预定义的 PV资源;注意 PV参数:accessModes
storageClassName
storage
容量大小必须两边匹配。
- 1.集群中查看
pod
pv
pvc
等资源
$ kubectl get pods -n kube-system|grep -E 'elasticsearch|fluentd|kibana'
elasticsearch-logging-0 1/1 Running 0 10m
elasticsearch-logging-1 1/1 Running 0 10m
fluentd-es-v2.0.2-6c95c 1/1 Running 0 10m
fluentd-es-v2.0.2-f2xh8 1/1 Running 0 10m
fluentd-es-v2.0.2-pv5q5 1/1 Running 0 10m
kibana-logging-d5cffd7c6-9lz2p 1/1 Running 0 10m
$ kubectl get pv
NAME CAPACITY ACCESS MODES RECLAIM POLICY STATUS CLAIM STORAGECLASS REASON AGE
pv-es-0 4Gi RWX Recycle Bound kube-system/elasticsearch-logging-elasticsearch-logging-0 es-storage-class 1m
pv-es-1 4Gi RWX Recycle Bound kube-system/elasticsearch-logging-elasticsearch-logging-1 es-storage-class 1m
pv-es-2 4Gi RWX Recycle Available es-storage-class 1m
$ kubectl get pvc --all-namespaces
NAMESPACE NAME STATUS VOLUME CAPACITY ACCESS MODES STORAGECLASS AGE
kube-system elasticsearch-logging-elasticsearch-logging-0 Bound pv-es-0 4Gi RWX es-storage-class 2m
kube-system elasticsearch-logging-elasticsearch-logging-1 Bound pv-es-1 4Gi RWX es-storage-class 1m
-
2.网页访问
kibana
查看具体的日志,如上须等待(约15分钟)kibana Pod
优化和 Cache 状态页面,达到Ready
状态。 -
3.登陆 NFS Server 查看对应目录和内部数据
$ ls /share
es0 es1 es2
PV
作为集群的存储资源,StatefulSet
依靠它实现 POD的状态数据持久化,但是当 StatefulSet
动态伸缩时,它的 PVC
请求也会变化,如果每次都需要管理员手动去创建对应的 PV
资源,那就很不方便;因此 K8S还提供了 provisioner
来动态创建 PV
,不仅节省了管理员的时间,还可以根据不同的 StorageClasses
封装不同类型的存储供 PVC 选用。
- 此功能需要
API-SERVER
参数--admission-control
字符串设置中包含DefaultStorageClass
,本项目中已经开启。 provisioner
指定 Volume 插件的类型,包括内置插件(如 kubernetes.io/glusterfs)和外部插件(如 external-storage 提供的 ceph.com/cephfs,nfs-client等),以下讲解使用nfs-client-provisioner
来动态创建PV
来持久化保存EFK
的日志数据。
确保 /etc/exports
配置如下共享目录,并确保 /share
目录可读可写权限,否则可能因为权限问题无法动态生成 PV的对应目录。(根据实际情况替换IP段192.168.1.*
)
/share 192.168.1.*(rw,sync,insecure,no_subtree_check,no_root_squash)
- 首先根据集群存储创建nfs-client-provisioner
- 然后按实际需求修改
es-dynamic-pv/es-statefulset.yaml
文件中 volumeClaimTemplates 设置的 storage: 4Gi 大小
# 如果之前已经安装了默认的EFK或者静态PV EFK,请用以下命令先删除它
$ kubectl delete -f /etc/ansible/manifests/efk/
$ kubectl delete -f /etc/ansible/manifests/efk/es-without-pv/
$ kubectl delete -f /etc/ansible/manifests/efk/es-static-pv/
# 安装动态PV 的 EFK
$ kubectl create -f /etc/ansible/manifests/efk/
$ kubectl create -f /etc/ansible/manifests/efk/es-dynamic-pv/
- 首先
nfs-client-provisioner.yaml
创建一个工作 POD,它监听集群的 PVC请求,并当 PVC请求来到时调用nfs-client
去请求nfs-server
的存储资源,成功后即动态生成对应的 PV资源。 nfs-dynamic-storageclass.yaml
定义 NFS存储类型的类型名nfs-dynamic-class
,然后在es-statefulset.yaml
中必须使用这个类型名才能动态请求到资源。
- 1.集群中查看
pod
pv
pvc
等资源
$ kubectl get pods -n kube-system|grep -E 'elasticsearch|fluentd|kibana'
elasticsearch-logging-0 1/1 Running 0 10m
elasticsearch-logging-1 1/1 Running 0 10m
fluentd-es-v2.0.2-6c95c 1/1 Running 0 10m
fluentd-es-v2.0.2-f2xh8 1/1 Running 0 10m
fluentd-es-v2.0.2-pv5q5 1/1 Running 0 10m
kibana-logging-d5cffd7c6-9lz2p 1/1 Running 0 10m
$ kubectl get pv
NAME CAPACITY ACCESS MODES RECLAIM POLICY STATUS CLAIM STORAGECLASS REASON AGE
pvc-50644f36-358b-11e8-9edd-525400cecc16 4Gi RWX Delete Bound kube-system/elasticsearch-logging-elasticsearch-logging-0 nfs-dynamic-class 10m
pvc-5b105ee6-358b-11e8-9edd-525400cecc16 4Gi RWX Delete Bound kube-system/elasticsearch-logging-elasticsearch-logging-1 nfs-dynamic-class 10m
$ kubectl get pvc --all-namespaces
NAMESPACE NAME STATUS VOLUME CAPACITY ACCESS MODES STORAGECLASS AGE
kube-system elasticsearch-logging-elasticsearch-logging-0 Bound pvc-50644f36-358b-11e8-9edd-525400cecc16 4Gi RWX nfs-dynamic-class 10m
kube-system elasticsearch-logging-elasticsearch-logging-1 Bound pvc-5b105ee6-358b-11e8-9edd-525400cecc16 4Gi RWX nfs-dynamic-class 10m
-
2.网页访问
kibana
查看具体的日志,如上须等待(约15分钟)kibana Pod
优化和 Cache 状态页面,达到Ready
状态。 -
3.登陆 NFS Server 查看对应目录和内部数据
$ ls /share # 可以看到类似如下的目录生成
kube-system-elasticsearch-logging-elasticsearch-logging-0-pvc-50644f36-358b-11e8-9edd-525400cecc16
kube-system-elasticsearch-logging-elasticsearch-logging-1-pvc-5b105ee6-358b-11e8-9edd-525400cecc16