1. 排查流程
/home/jenkins-build/build/workspace/ceph-build/ARCH/x86_64/AVAILABLE_ARCH/x86_64/AVAILABLE_DIST/centos8/DIST/centos8/MACHINE_SIZE/gigantic/release/16.2.7/rpm/el8/BUILD/ceph-16.2.7/src/os/bluestore/BlueFS.cc: 2768: ceph_abort_msg("bluefs enospc")
这次的问题其实就是 Ceph 检测到存储空间快满了,达到了预警阈值,它为了避免出问题,直接禁止继续写入了,防止影响正常使用。后来在 UI 上看了一圈,发现有同事对 KubeSphere 这块还不太熟,通过它创建有状态服务的时候也顺带创建了几个特别大的存储卷动不动就是几百 GB,但实际上里面才用了几十 MB 的数据。Ceph 和 VMware 不一样,他是你申请多少就直接占用多少,也会直接减去可用空间百分比。你要 500 GB,它就真的从存储里划出 500 GB,不管你用没用上。所以这样一来,虽然实际数据量很小,但看起来空间一下就被占满了,Ceph 就报警禁止写入了,这才出现了这个问题。