当前位置: 首页 > news >正文

debugger(四):源代码

〇、前言

终于来到令人激动的源代码 level 了,这里将会有一些很有意思的算法,来实现源代码级别的调试,这将会非常有趣。

一、使用 libelfin 库

我们不可能直接去读取整个 .debug info 段来进行设置,这是没有必要的,可以使用现成的库。首先初始化 debugger 对象:

class debugger {
public:debugger (std::string prog_name, pid_t pid): m_prog_name{std::move(prog_name)}, m_pid{pid} {auto fd = open(m_prog_name.c_str(), O_RDONLY);m_elf = elf::elf{elf::create_mmap_loader(fd)};m_dwarf = dwarf::dwarf{dwarf::elf::create_loader(m_elf)};}//...private://...dwarf::dwarf m_dwarf;elf::elf m_elf;
};

不必太过关注这里函数的细节,只需要关注它们做了什么。事实上,m_dwarf、m_elf 和 文件名 m_prog_name 关联起来了,然后就交给它们进行处理了。我们还需要知道 load_addr,这非常重要,因为debuf info 只会提供静态的信息,load_addr 取决于运行时,因此得想办法在 /proc 中获取:

void Debugger::initialise_load_address() {if (m_elf.get_hdr().type == elf::et::dyn) {std::ifstream map("/proc/" + std::to_string(m_pid) + "/maps");//Read the first address from the filestd::string addr;std::getline(map, addr, '-');m_load_address = std::stoi(addr, 0, 16);}
}

二、获取信息

通过一个 pc 怎么获取函数名呢?注意这个 pc 是一个 offset addr,传参的时候一定要转换。思路很简单,首先遍历所有的 cu,然后判断 culow_pchigh_pc,如果在这个 cu 符合,那么就通过 cu 拿到 cu.rootcu.root 是一个根 die,通过它可以遍历所有的 die。之后再判断 dietag 是不是一个函数,如果是且包含 pc,那么就是我们要找的函数。实现如下:

dwarf::die Debugger::get_function_from_pc(std::intptr_t pc) {for (auto &cu : m_dwarf.compilation_units()) { // 循环遍历所有cuif (die_pc_range(cu.root()).contains(pc)) {for (const auto &die :cu.root()) { if (die.tag ==dwarf::DW_TAG::subprogram) { if (die_pc_range(die).contains(pc)) {return die;}}}}}throw std::out_of_range{"Cannot find function"};
}

接着通过 pc 来获取 line entry:

dwarf::line_table::iterator Debugger::get_line_entry_from_pc(uint64_t pc) {for (auto &cu : m_dwarf.compilation_units()) {if (die_pc_range(cu.root()).contains(pc)) {auto &lt = cu.get_line_table();auto it = lt.find_address(pc);if (it == lt.end()) {throw std::out_of_range{"Cannot find line entry"};}else {return it;}}}throw std::out_of_range{"Cannot find line entry"};
}

接着我们打印源代码。思路是通过 debug info 中的源代码路径和 line table 来获取,好消息是,我们不必做更多的底层实现:

void Debugger::print_source(const std::string& file_name, unsigned line, unsigned n_lines_context) {std::ifstream file {file_name};auto start_line = line <= n_lines_context ? 1 : line - n_lines_context;auto end_line = line + n_lines_context + (line < n_lines_context ? n_lines_context - line : 0) + 1;char c{};auto current_line = 1u;while (current_line != start_line && file.get(c)) {if (c == '\n') {++current_line;}}std::cout << (current_line==line ? "> " : "  ");while (current_line <= end_line && file.get(c)) {std::cout << c;if (c == '\n') {++current_line;std::cout << (current_line==line ? "> " : "  ");}}std::cout << std::endl;
}

三、测试

minidbg> break 0x555555555191
Set breakpoint at address 0x555555555191
minidbg> conti
Hit breakpoint at adsress 0x555555555191#include <iostream>int main() {
>   std::cerr << "hello,world0.\n";return 0;}

我们确实成功的打印出了源代码。上述基本的信息获取,基本思路就是对 DWARF 的理解,然后利用库函数接口获取我们想要的信息。

http://www.lryc.cn/news/369020.html

相关文章:

  • 基于运动控制卡的圆柱坐标机械臂设计
  • MongoDBTemplate-基本文档查询
  • 23种设计模式——创建型模式
  • idm究竟有哪些优势
  • 如何学习Golang语言!
  • Redis系列之淘汰策略介绍
  • sql 调优
  • 【UML用户指南】-13-对高级结构建模-包
  • 前端面试题日常练-day63 【面试题】
  • GAN的入门理解
  • 43【PS 作图】颜色速途
  • 定个小目标之刷LeetCode热题(13)
  • 【AI大模型】Prompt Engineering
  • centos安装vscode的教程
  • 面试题------>MySQL!!!
  • 英伟达:史上最牛一笔天使投资
  • PDF分页处理:技术与实践
  • 数据可视化——pyecharts库绘图
  • Python的return和yield,哪个是你的菜?
  • 持续总结中!2024年面试必问 20 道分布式、微服务面试题(七)
  • AJAX 跨域
  • 3 数据类型、运算符与表达式-3.1 C语言的数据类型和3.2 常量与变量
  • NSSCTF-Web题目5
  • cnvd_2015_07557-redis未授权访问rce漏洞复现-vulfocus复现
  • 免费,C++蓝桥杯等级考试真题--第7级(含答案解析和代码)
  • python为什么要字符串格式化
  • go语言后端开发学习(三)——基于validator包实现接口校验
  • 系统架构设计师【补充知识】: 应用数学 (核心总结)
  • 【ArcGIS微课1000例】0118:一文讲清楚tif(geotiff)栅格数据格式
  • 调用第三方API --------------Python篇