当前位置: 首页 > news >正文

ebpf实战(一)-------监控udp延迟

问题背景:
为了分析udp数据通信中端到端的延迟,我们需要对整个通信链路的每个阶段进行监控,找出延迟最长的阶段.

udp接收端有2个主要路径
1.数据包到达本机后,由软中断处理程序将数据包接收并放入udp socket的接收缓冲区
在这里插入图片描述

数据接收流程
2. 应用程序调用recvmsg等api将数据从socket缓冲区读出
在这里插入图片描述

应用程序读取数据流程
2和1之间可能由于调度等造成延迟,我们写一个bcc程序对指定接收端口和延迟大于某个值的情况进行监控

bcc程序原理
我们在流程1放入udp缓冲区时(udp_unicast_rcv_skb),记录此skb的时间

然后在流程2读取udp缓冲区时(__skb_recv_udp)时取出1中记录的skb时间,并与当前时间做差值得到延迟.

#!/usr/bin/python3
# @lint-avoid-python-3-compatibility-imports
#
# udplatency    Trace long udp recvmsg delays.
#               For Linux, uses BCC, eBPF.
#
# This script traces high delays between skb being
# ready to in recv queue and them recvmsg on CPU after that.
#
# USAGE: udplatency [-d dport] [-l lat]import argparse
import ctypes as ct
from time import strftime
from bcc import BPFbpf_text = '''
# include <linux/ip.h>
# include <linux/netfilter.h>
# include <net/ip.h>
# include <uapi/linux/bpf.h>struct data_t {u64 ts;u64 lat;
};BPF_PERF_OUTPUT(events);
BPF_HASH(recv_lat, struct sk_buff*);int kprobe__udp_unicast_rcv_skb(struct pt_regs *ctx, struct sock *sk, struct sk_buff* skb)
{struct udphdr *udp_hdr = (struct udphdr *)(skb->head + skb->transport_header);u16 dst_port = bpf_ntohs(udp_hdr->dest);if (dst_port == DST_PORT) {u64 ts = bpf_ktime_get_ns();recv_lat.update(&skb, &ts);}return 0;
};int kretprobe____skb_recv_udp(struct pt_regs *ctx)
{struct sk_buff* skb = (struct sk_buff*)PT_REGS_RC(ctx);struct udphdr *udp_hdr = (struct udphdr *)(skb->head + skb->transport_header);u16 dst_port = bpf_ntohs(udp_hdr->dest);if (dst_port == DST_PORT) {struct data_t data = {};u64 *tsp = recv_lat.lookup(&skb);if (tsp != 0) {Home = bpf_ktime_get_ns() - *tsp;}recv_lat.delete(&skb);if (data.lat >= LAT_NS) {bpf_probe_read_kernel(&(data.ts), sizeof(*tsp), tsp);events.perf_submit(ctx, &data, sizeof(data));}}return 0;
}
'''class EventData(ct.Structure):_fields_ = [("ts", ct.c_ulonglong),("lat", ct.c_ulonglong)]def print_event(cpu, data, size):event = ct.cast(data, ct.POINTER(EventData)).contentsprint("%-8s ts:%d lat: %dms\n" % (strftime("%H:%M:%S"), event.ts, event.lat / 3000000))parser = argparse.ArgumentParser(description="Track udp recv latency")
parser.add_argument("-d", "--dport", type=int, required=True,help="udp dst port")
parser.add_argument("-l", "--lat", type=int,help="report latency > ns, default is 3000000")
args = parser.parse_args()lat_ns = 3000000if args.lat:lat_ns = args.latbpf_text = bpf_text.replace('DST_PORT', str(args.dport))
bpf_text = bpf_text.replace('LAT_NS', str(lat_ns))# initialize BPF
b = BPF(text=bpf_text)b["events"].open_perf_buffer(print_event)
while True:try:b.perf_buffer_poll()except KeyboardInterrupt:exit()
http://www.lryc.cn/news/241299.html

相关文章:

  • 中西部各省市翻译协会、公关协会会长金秋圆桌会议圆满结束
  • 极盾故事|“五步”构建某三甲医院数据安全管理集成平台
  • 【开题报告】基于uni-app的恋爱打卡app的设计与实现
  • Python 2.7 在 Debian 服务器上获取 URL 时的 SSL 验证失败问题与解决方案
  • 导出文件到指定路径??
  • 腾讯微服务平台TSF学习笔记(二)--如何使用spring cloud zuul实现线上流量复制
  • React自定义Hook之useRequest
  • 【LeetCode】挑战100天 Day13(热题+面试经典150题)
  • Android 11.0 SystemUI 去掉状态栏wifi流量上下行图标功能实现
  • 掌握Net User命令:轻松创建、修改、删除和查看本地用户帐户
  • 性能优化中使用Profiler进行页面卡顿的排查及解决方式
  • 深入了解Java8新特性-日期时间API_LocalDate类
  • PyTorch基本操作和工作流程
  • Android开发从0开始(ContentProvider与数据)
  • STM32_6(TIM)
  • Linux中flask项目开启https访问
  • Kubernetes 离线部署 Spinnaker
  • TypeScript 学习笔记 第三部分 贪吃蛇游戏
  • 【spring(一)】核心容器总结
  • 易点易动固定资产管理系统:实现全面的固定资产采购管理
  • 力扣:178. 分数排名(Python3)
  • raid磁盘阵列
  • SpringBoot学习笔记-实现微服务:匹配系统(上)
  • 重磅!全球首个“绿色黑灯工厂”落户中国,竟然是这家企业……
  • go语言学习-异常处理
  • 如何使用 JavaScript 实现图片上传并转换为 LaTeX 公式
  • 深刻理解MySQL8游标处理中not found
  • 甄知燕千云与SAP、EBS、TC、NS等应用深度集成,智能提单一键畅通,效能一键提升
  • 第99步 深度学习图像目标检测:SSDlite建模
  • 用EasyAVFilter将网络文件或者本地文件推送RTMP出去的时候发现CPU占用好高,用的也是vcodec copy呀,什么原因?