当前位置: 首页 > news >正文

ceph学习笔记

ceph

ceph osd lspoolsrbd ls -p testpool#查看 ceph 集群中有多少个 pool,并且每个 pool 容量及利 用情况
rados dfceph -sceph osd tree
ceph dfceph versionsceph osd pool lsceph osd crush rule dumpceph auth print-key client.adminceph orch host lsceph crash lsceph osd pool statsceph df detail
ceph osd statceph mon stat查看image rbd
rbd ls -p kubeceph osd df
ceph osd pool autoscale-statusceph: 
10.240.62.11/12/13
root:autelceph2  用户名:autel
密码:Autonomy@Autel13 Autel#3913[root@ceph-admin ~]# ceph mgr services
{"dashboard": "https://10.250.53.152:8443/","prometheus": "http://10.250.53.152:9283/"
}kubectl logs -f qinzhao-cache-resunet-demo-pipeline-wbkkh-2890309351 -n qinzhao -c lustre-importer-preloadkubectl get nodes "-o=custom-columns=NAME:.metadata.name,GPU:.status.allocatable.nvidia\.com/gpu"apps/jupyter/jupyter-web-app/upstream/base/configs/spawner_ui_config.yamlkustomize build apps/jupyter/jupyter-web-app/upstream/overlays/istio | kubectl apply -f -kustomize build  apps/tensorboard/tensorboard-controller/upstream/overlays/kubeflow | kubectl apply -f -kubectl get pods -n kubeflow -l kustomize.component=profileshttps://www.amazonaws.cn/ec2/instance-types/kubectl taint node autel-poweredge-r750 nodetype=T4:NoExecute
kubectl taint node autelrobotics-gpu10 nodetype=RTX3090:NoExecute
autelrobotics-gpu10
kubectl taint node autel-poweredge-r750 nodetype:NoExecute-kubectl taint node autelrobotics-gpu09 nodetype:NoSchedule-kubectl taint node autelrobotics-gpu09 nodetype:NoExecute-nodegroup=gpu:NoSchedulekubectl taint nodes autelrobotics-gpu02 nodegroup=gpu:NoSchedulekubectl label node autelrobotics-gpu02 gputype=A40lsof -n -P -i:22stracekubectl get csinode
查看活跃进程个数
top -H -p 1kubectl create secret tls ai-tls \--namespace ai-test \--key tls.key \--cert tls.pemhttps://github.com/NVIDIA/nvidia-docker/issues/1678
nvidia-container-cli -k -d /dev/tty infols -l /dev/char
cat /etc/nvidia-container-runtime/config.tomlstat -fc %T /sys/fs/cgroup/sar -n TCP,ETCP 1fdisk -lldd# 修改后,重新挂载生效
# mount -o remount /dev/shmnstat
mpstat -P all 1
slabtop
pcstatnetstat -ant | awk '{print $6}' | sort | uniq -c | sort -ndmesg -T
pmap -x  1649 | sort -k 3 -n -r
cat /proc/1649/smaps | grep 7f4250021000
dump memory memory.dump 0x7f2340539000 0x7f235d553000strings memory.dumppidstat -p pid -r 1 1000
sudo ./stackcount ip_outputdmesg -Tw
perf
NetHogsiftop -i eth0 -P -N
./opensnoop -Tn snmp-pass
slabtopnfsstat -cdu -ah --max-depth=2 /var/log |sort -rh |head -10./fileslower
ulimit -a解决显存释放问题:
fuser -v /dev/nvidia*lsof -Pninetstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'

在这里插入图片描述

NFS运维:

systemctl status rpcbind nfs-server
nfsiostat
dmesg | grep nfs
exportfs -v
mpstat -P ALL 1
ss -t -a |grep "IP"nfsstat -c
iostat iostat -d -x -k 1netstat -an | "IP:2049"dstat
ps aux | grep /apphttps://learnku.com/articles/39851
https://zhuanlan.zhihu.com/p/614314627fdisk -lblkidnfsiostat  1sar -b 1iostat -m -d /dev/md0 1strace -p pid 查看进程当前调用栈,查死循环或者卡顿时极为有用
strace -eopen /usr/local/kk-mail/service/dovecot/sbin/dovecot  查看进程当前打开了哪些文件 cat /proc/715765/*/task/stack/proc/12544/task/12873/stack
systemtapcat /var/log/Xorg.0.log |grep -i "nvidia"

ss

sasfa

http://www.lryc.cn/news/234303.html

相关文章:

  • SQLSERVER 遍历循环的两种方式很详细有源码(2)
  • flutter背景图片设置
  • 【运维 监控】Grafana + Prometheus,监控Linux
  • Sentinel底层原理(下)
  • 竞赛选题 疫情数据分析与3D可视化 - python 大数据
  • macos 配置ndk环境
  • 【linux】进行间通信——共享内存+消息队列+信号量
  • PlantUML基础使用教程
  • Redis:新的3种数据类型Bitmaps、HyperLoglog、Geographic
  • promise时效架构升级方案的实施及落地 | 京东物流技术团队
  • es的使用方法以及概念
  • WPF xaml Command用法介绍
  • 微信小程序动态生成表单来啦!你再也不需要手写表单了!
  • 顺序表(数据结构与算法)
  • 【大连民族大学C语言CG题库练习题】——判断一个矩阵是另一个矩阵的子矩阵
  • C#WPF控制模板实例
  • MATLAB Simulink和S7-1200PLC MOBUSTCP通信
  • 五、函数的介绍
  • 【广州华锐互动VRAR】VR元宇宙技术在气象卫星知识科普中的应用
  • F. Alex‘s whims Codeforces Round 909 (Div. 3) 1899F
  • 面试题-5
  • 车载以太网-ARP
  • Kafka学习笔记(三)
  • JVM-HotSpot虚拟机对象探秘
  • 大模型技术的发展:开源和闭源,究竟谁强谁弱又该何去何从?
  • Python学习笔记--自定义元类
  • 软件测试 —— 常见的自动化测试架构!
  • Python 的 @lru_cache() 装饰器
  • Swift制作打包framework
  • 无线WiFi安全渗透与攻防(N.2)WPA渗透-使用airolib-ng创建彩虹表加速