创建ceph存储时常见问题汇总

背景

OS:Ubuntu 16.04
修改了osd的一些配置,修改后,需要重启osd服务才能生效。第一次重启后,配置立刻生效。再改了一些配置,重启osd服务后,配置却不再生效了。ps命令查看进程,发现osd进程都没有启动。

分析

osd进程未启动,第一直觉就是配置出错,osd进程启动后又挂掉。于是,进入/var/log/ceph目录,查看ceph-osd.0.log,发现日志末尾只有关闭进程的相关日志,并没有osd启动的信息。再查看该日志的时间,时间就是关闭服务时的时间。换句话说,第二次重启服务后,osd没有启动。既然没有启动,那就不是osd本身的问题,而是和重启服务的命令systemctl restart ceph-osd.target相关了。
先检查下osd服务的状态。

$ systemctl status ceph-osd.target

● ceph-osd.target – ceph target allowing to start/stop all [email protected] instances at once
Loaded: loaded (/lib/systemd/system/ceph-osd.target; enabled; vendor preset: enabled)
Active: inactive (dead) since Sun 2017-03-05 16:52:04 CST; 3s ago

果然,服务是inactvice的。再查看服务相关的日志:

$ journalctl -xe

Mar 05 14:21:43 node3 systemd[1]: [email protected]: Start request repeated too quickly.
Mar 05 14:21:43 node3 systemd[1]: Failed to start Ceph object storage daemon.

果然是服务启动失败,并且给出的原因是启动请求太快。这很可能和osd服务的配置有关,打开osd服务配置文件/etc/systemd/system/ceph-osd.target.wants/[email protected],发现有服务器启动间隔的限制,并且限制时间为30分钟,难怪第一次启动服务成功,而第二次就失败了。
$ vi /etc/systemd/system/ceph-osd.target.wants/[email protected]

StartLimitInterval=30min

解决方案

注释掉服务配置文件的启动间隔限制,并且重新加载服务配置。

$ systemctl daemon-reload
再重启osd服务,并检查osd服务的状态。

$ systemctl restart ceph-osd.target
$ systemctl status ceph-osd.target
● ceph-osd.target – ceph target allowing to start/stop all [email protected] instances at once
Loaded: loaded (/lib/systemd/system/ceph-osd.target; enabled; vendor preset: enabled)
Active: active since Sun 2017-03-05 16:47:53 CST; 5s ago

Mar 05 16:47:53 node2 systemd[1]: Reached target ceph target allowing to start/stop all [email protected] instances at once.

服务状态变为active,问题解决。

此条目发表在ceph分类目录,贴了标签。将固定链接加入收藏夹。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注