k8s通过NUMA亲和分配GPU和VF接口
问题
一般情况下,sriov插件和gpu分配插件是单独工作的,网卡和GPU没有根据连接关系分配
如果一个节点起了多个容器,会造成GPU和网卡的通信瓶颈
修改
如果一个点起两个容器,可以按照NUMA亲和来分配
修改kubelet配置文件/var/lib/kubelet/config.yaml
topologyManagerPolicy选择restricted
topologyManagerPolicy: single-numa-node [none|best-effort|restricted|single-numa-node]
topologyManagerScope: pod
然后:
sudo systemctl daemon-reload
sudo systemctl restart kubelet