@@ -13,13 +13,13 @@ if [ -z "$QUIET_CONSOLE" ]; then
13
13
kubectl get pod -l ${KUBE_POD_LABEL_SELECTOR} ${KUBE_CONTEXT_ARG} ${KUBE_NS_ARG} -o name \
14
14
--field-selector=status.phase==Running \
15
15
| xargs ${REPLSIZE} -P128 -I {} -n1 \
16
- sh -c " sleep 0.\$ (shuf -i 100-2000 -n1); kubectl exec --pod-running-timeout=1h ${KUBE_CONTEXT_ARG} ${KUBE_NS_ARG} {} -- sh -c \" nvidia-smi --query-gpu=timestamp,utilization.gpu,utilization.memory,memory.total,temperature.gpu,name --format=csv,noheader -l 10 | awk -Winteractive -v pod=\\\$ (hostname) -F, '{printf \\\" \n\033[31;1m%s \033[0;31mGPUType\t\t\033[0;2m%s %s\033[0m\n\\\" , \\\$ 6, pod, \\\$ 1; printf \\\" \033[31;1m%s \033[0;31mUtilization.GPU\t\t\t\033[0;2m%s %s\033[0m\n\\\" , \\\$ 2, pod, \\\$ 1; printf \\\" \033[31;1m%s \033[0;31mUtilization.Memory\t\t\t\033[0;2m%s %s\033[0m\n\\\" , \\\$ 3, pod, \\\$ 1; printf \\\" \033[31;1m%s \033[0;31mMemory.Total\t\t\t\033[0;2m%s %s\033[0m\n\\\" , \\\$ 4, pod, \\\$ 1; printf \\\" \033[31;1m%s \033[0;31mTemperature.GPU\t\t\t\033[0;2m%s %s\033[0m\n\\\" , \\\$ 5, pod, \\\$ 1; }'\" " \
16
+ sh -c " sleep 0.\$ (shuf -i 100-2000 -n1); kubectl exec --pod-running-timeout=1h ${KUBE_CONTEXT_ARG} ${KUBE_NS_ARG} {} -- sh -c \" nvidia-smi --query-gpu=timestamp,utilization.gpu,utilization.memory,memory.total,temperature.gpu,name --format=csv,noheader -l 10 | awk -Winteractive -v pod=\\\$ (hostname | sed -E 's/-[0-9a-fA-F]{8}-[0-9a-fA-F]{4}-[0-9a-fA-F]{4}-[0-9a-fA-F]{4}-[0-9a-fA-F]{12}//' ) -F, '{printf \\\" \n\033[31;1m%s \033[0;31mGPUType\t\t\033[0;2m%s %s\033[0m\n\\\" , \\\$ 6, pod, \\\$ 1; printf \\\" \033[31;1m%s \033[0;31mUtilization.GPU\t\t\t\033[0;2m%s %s\033[0m\n\\\" , \\\$ 2, pod, \\\$ 1; printf \\\" \033[31;1m%s \033[0;31mUtilization.Memory\t\t\t\033[0;2m%s %s\033[0m\n\\\" , \\\$ 3, pod, \\\$ 1; printf \\\" \033[31;1m%s \033[0;31mMemory.Total\t\t\t\033[0;2m%s %s\033[0m\n\\\" , \\\$ 4, pod, \\\$ 1; printf \\\" \033[31;1m%s \033[0;31mTemperature.GPU\t\t\t\033[0;2m%s %s\033[0m\n\\\" , \\\$ 5, pod, \\\$ 1; }'\" " \
17
17
| tee " ${STREAMCONSUMER_RESOURCES} gpu.txt" \
18
18
1>&2
19
19
else
20
20
kubectl get pod -l ${KUBE_POD_LABEL_SELECTOR} ${KUBE_CONTEXT_ARG} ${KUBE_NS_ARG} -o name \
21
21
--field-selector=status.phase==Running \
22
22
| xargs ${REPLSIZE} -P128 -I {} -n1 \
23
- sh -c " sleep 0.\$ (shuf -i 100-2000 -n1); kubectl exec --pod-running-timeout=1h ${KUBE_CONTEXT_ARG} ${KUBE_NS_ARG} {} -- sh -c \" nvidia-smi --query-gpu=timestamp,utilization.gpu,utilization.memory,memory.total,temperature.gpu,name --format=csv,noheader -l 10 | awk -Winteractive -v pod=\\\$ (hostname) -F, '{printf \\\" \n\033[31;1m%s \033[0;31mGPUType\t\t\033[0;2m%s %s\033[0m\n\\\" , \\\$ 6, pod, \\\$ 1; printf \\\" \033[31;1m%s \033[0;31mUtilization.GPU\t\t\t\033[0;2m%s %s\033[0m\n\\\" , \\\$ 2, pod, \\\$ 1; printf \\\" \033[31;1m%s \033[0;31mUtilization.Memory\t\t\t\033[0;2m%s %s\033[0m\n\\\" , \\\$ 3, pod, \\\$ 1; printf \\\" \033[31;1m%s \033[0;31mMemory.Total\t\t\t\033[0;2m%s %s\033[0m\n\\\" , \\\$ 4, pod, \\\$ 1; printf \\\" \033[31;1m%s \033[0;31mTemperature.GPU\t\t\t\033[0;2m%s %s\033[0m\n\\\" , \\\$ 5, pod, \\\$ 1; }'\" " \
23
+ sh -c " sleep 0.\$ (shuf -i 100-2000 -n1); kubectl exec --pod-running-timeout=1h ${KUBE_CONTEXT_ARG} ${KUBE_NS_ARG} {} -- sh -c \" nvidia-smi --query-gpu=timestamp,utilization.gpu,utilization.memory,memory.total,temperature.gpu,name --format=csv,noheader -l 10 | awk -Winteractive -v pod=\\\$ (hostname | sed -E 's/-[0-9a-fA-F]{8}-[0-9a-fA-F]{4}-[0-9a-fA-F]{4}-[0-9a-fA-F]{4}-[0-9a-fA-F]{12}//' ) -F, '{printf \\\" \n\033[31;1m%s \033[0;31mGPUType\t\t\033[0;2m%s %s\033[0m\n\\\" , \\\$ 6, pod, \\\$ 1; printf \\\" \033[31;1m%s \033[0;31mUtilization.GPU\t\t\t\033[0;2m%s %s\033[0m\n\\\" , \\\$ 2, pod, \\\$ 1; printf \\\" \033[31;1m%s \033[0;31mUtilization.Memory\t\t\t\033[0;2m%s %s\033[0m\n\\\" , \\\$ 3, pod, \\\$ 1; printf \\\" \033[31;1m%s \033[0;31mMemory.Total\t\t\t\033[0;2m%s %s\033[0m\n\\\" , \\\$ 4, pod, \\\$ 1; printf \\\" \033[31;1m%s \033[0;31mTemperature.GPU\t\t\t\033[0;2m%s %s\033[0m\n\\\" , \\\$ 5, pod, \\\$ 1; }'\" " \
24
24
> " ${STREAMCONSUMER_RESOURCES} gpu.txt"
25
25
fi
0 commit comments