分类运维技术下的文章

我原来CEPH集群的OSD是默认方式创建的，即“ceph-deploy osd create ceph-node-1 --data /dev/bcache0”，因为性能遇到瓶颈，为了充分榨干nvme aic ssd，决定重建osd把WAL/DB分区放到nvme aic ssd上。目前社区和官方说只有重建方式，ceph允许同时存在2种不同的osd，所以可以平滑的过度。

我有4个节点，所以我每次重建4个osd，重建osd数量应保持在总数20%左右，不应一次性操作太多。

- 阅读剩余部分 -

CEPH Bcache优化及与WAL/DB盘型号的选择,预留容量

作者: admin
时间: 2021-11-08
分类: Ceph
评论

为了提高CEPH HDD的性能，我买了Samsung 983ZET用来做Bcache缓存盘。

4个CEPH节点，每个节点OSD配置：4x4TB HDD，Samsung 983ZET一拖四用作Bcache缓存盘。1500个左右VM，平时负荷差不多23MiB/s wr | 1.5k op/s上下wr，rbd上的VM 60以上线程并发写入时经常有500ms以上的io延迟，偶尔延迟达到1000ms以上，如果更高并发写入时有时候甚至超过10000ms延迟，使用影响很大，但是并发读的却非常低的延迟一般保持在0ms，偶尔上个几十ms。

- 阅读剩余部分 -

centos ceph raid0 bcache 故障osd更换

作者: admin
时间: 2021-10-12
分类: Ceph
评论

首先停止故障osd运行:

# ceph osd out osd.4
# systemctl stop ceph-osd@4.service

解除bcache绑定（停用前端缓存），假设故障osd是建立在bcache1上，缓存盘的cset-uuid为805bc5f1-36e9-4685-a86a-3ea8c03f1172，我osd只是偶尔出现错误即将故障，而不是不能识盘，所以正常解除绑定清理脏数据:

# echo 805bc5f1-36e9-4685-a86a-3ea8c03f1172  > /sys/block/bcache1/bcache/detach

- 阅读剩余部分 -

centos raid0掉盘后盘符变化导致bcache故障

作者: admin
时间: 2021-10-05
分类: Ceph
评论

下午收到故障警报，有个ceph节点osd故障。故障osd建立在节点bcache2分区上，但是这分区不见了，bcache2是一个RAID0的前端缓存分区。

通过MegaRAID检查RAID硬盘状态，发现有个RAID0下的硬盘变成外来设备了：

/opt/MegaRAID/MegaCli/MegaCli64 -PDList -aALL -NoLog|grep "Firmware state"

Firmware state: Unconfigured(good), Spun Up

也就是没有RAID信息列阵不识别这个盘了，也许是高负荷下掉盘又恢复后无法识别了？但起码盘还能识到，也就是说可能盘还没坏，可以尝试RAID导入一下外来配置：

- 阅读剩余部分 -

ceph故障 osd slow ops, oldest one blocked for {num}

作者: admin
时间: 2021-07-13
分类: Ceph
评论

错误类似：26 slow ops, oldest one blocked for 48 sec, daemons [osd.15,osd.17,osd.18,osd.5,osd.6,osd.7] have slow ops.

如果只是集群中极少部分的OSD出现该问题，可以通过：

systemctl status ceph-osd@{num}

查看OSD日志找到问题并处理，常见的有磁盘故障等，根据错误网络搜索很多解决方案。

如果是集群中所有osd，或者过半数的osd出现这个问题呢？检查了磁盘、网络、mon都正常。其实还有一种可能，想一下是否近期升级过ceph，有升级不完整osd版本问题造成。

- 阅读剩余部分 -

CEPH自动调整PG merging（最低要求Nautilus版本）

作者: admin
时间: 2021-07-13
分类: Ceph
评论

自Nautilus版本开始Ceph支持自动调整PG merging，减少了每次加osd时候自己计算、修改的麻烦。

但其实自己计算也是很简单的，一个原则就是每个OSD大约能够分配到100pg就是合理的范围，计算公式：

（OSD数量×100）÷副本数量，如果有多个pool，还需要再除以pool数量，结果取接近计算值的2次幂。比如16个OSD ÷ 3副本÷ 1个pool，计算就是：(16×100）÷3÷1= 533.33，近2次幂的就是512了。

- 阅读剩余部分 -

Ceph应用Bcache加速后增加OSD或停用Bcache

作者: admin
时间: 2021-07-06
分类: Ceph
评论

如果CEPH已经使用Bcache缓存加速了OSD，使用未加速的OSD也需要应用Bcache缓存加速，则可以参考下文连贯操作记录，如有出错请留言。

查看当前分区

[root@ceph-node-1 ceph-admin-node]# lsblk
NAME                                                                                                    MAJ:MIN RM   SIZE RO TYPE MOUNTPOINT
nvme0n1                                                                                                 259:0    0 447.1G  0 disk 
├─bcache0                                                                                               252:0    0   3.7T  0 disk 
│ └─ceph--60bcd20c--264c--489b--8315--6b3fe7d9753b-osd--block--40eedca5--3120--416a--a021--b1dceaa15815 253:1    0   3.7T  0 lvm  
└─bcache1                                                                                               252:128  0   3.7T  0 disk 
  └─ceph--f67b425f--a786--42db--8ee7--d0dad6fb2ba4-osd--block--949401de--81d5--477c--8f22--b8c01e671d58 253:2    0   3.7T  0 lvm  
sdd                                                                                                       8:48   0   3.7T  0 disk 
sdb                                                                                                       8:16   0   3.7T  0 disk 
└─bcache0                                                                                               252:0    0   3.7T  0 disk 
  └─ceph--60bcd20c--264c--489b--8315--6b3fe7d9753b-osd--block--40eedca5--3120--416a--a021--b1dceaa15815 253:1    0   3.7T  0 lvm  
sde                                                                                                       8:64   0   3.7T  0 disk 
sdc                                                                                                       8:32   0   3.7T  0 disk 
└─bcache1                                                                                               252:128  0   3.7T  0 disk 
  └─ceph--f67b425f--a786--42db--8ee7--d0dad6fb2ba4-osd--block--949401de--81d5--477c--8f22--b8c01e671d58 253:2    0   3.7T  0 lvm  
sda                                                                                                       8:0    0 232.4G  0 disk 
├─sda2                                                                                                    8:2    0 231.9G  0 part 
│ └─centos-root                                                                                         253:0    0 231.9G  0 lvm  /
└─sda1                                                                                                    8:1    0   512M  0 part /boot

- 阅读剩余部分 -