用 Docker 获取 root 然后偷感十足的扩容

某公司的某 node 上有 8xA100,但是大伙却都挤在一张 500GB 的 SATA 作业,存储甚至没显存高。导致某人在跑实验的时候经常心神不宁,看到随机随时下降的 Avail,恐 No space left on device。

终于在某天晚上某人终于忍不住了,借用 docker

docker run -it --rm --privileged --pid=host quay.io/fedora/fedora:41 nsenter -t $$ -a

过了把 root 瘾,结果发现这个 node 居然有两个没有挂载的 3T 盘,某人一生炼丹如履薄冰,守着 500G 跑 LLM,想到这里,某人心中顿时悲愤,简单看了下硬盘似乎没有被分区正好自家 lvm 是 xfs,于是分区挂载之,先做个小目标分出来 1 个 T。

看到 Avail 928G,心中舒适了许多。

1 Like

我也干过

1 Like

其实还心有余悸就是不知道那两个硬盘到底是干嘛的。。