当前位置：首页 > news >正文

让逆向工程师们头疼的代码混淆，就像永远也走不出的“浪浪山”

news 2025/7/6 20:26:10

代码混淆究竟是什么？

如何做代码混淆？

代码混淆不等于加密

App 加固非一时之功

“我想离开浪浪山。”

在数次尝试破解某个App 时，某个逆向工程师无奈感慨道。

逆向工程师顾名思义就是把一个个完整的软件逆推，还原成一段段代码，方便破解。

比如给他们一个手机App、电脑程序，用不了多久，他们就能逆推出程序的运行逻辑，找到其中的关键代码，篡改、破解、发现漏洞。

这其中最好的例子就是盗版软件。开发者们累死累活才写好的程序，分分钟就被人逆向破解，植入广告和木马，重新打包成盗版。

但逆向工程师并非是反面形象，亦有好坏之分，正义的逆向者只是做安全研究，而那些非正义的逆向者却拿着这项技能四处干坏事牟利。

因此，二者的对立也尤为明显，一方为了防破解使出浑身解数，一方为了破解绞尽脑汁。

今天，我们就来讲讲关于让非正义的逆向工程师们头疼的代码混淆。

代码混淆究竟是什么？

关于代码混淆，百度百科给出的解释是：代码混淆（Obfuscation）是将电脑程序的原始代码或机器代码，转换成功能上等价，但是难于被人阅读和理解的行为。混淆后的代码，会将原先有明确含义的类名、字段、函数等转为无意义的单词，这样对于计算机来说，执行逻辑还是正常的，但是当人们去分析混淆后的代码时，会加大阅读和理解的难度，以此来加强代码的保护。

什么意思呢？

我们可以简单理解为代码开发者是想给破解者（逆向工程师）制造一个假象，从而让他们从其他角度去尝试破解，但破解之后发现方向是错的，便又需要重新找角度破解，增加破解难度，也给开发者们充分时间来对抗破解。

举个例子。

你想去超市买水果，但又不想让人知道，于是你先去买了卫生纸回来，又去了健身房，然后又去超市买了可乐，最后才去超市买了水果。

这样一来，别人对你的行动目的就不是明确的，需要多次猜测推理才能知道你的目的。代码混淆的逻辑便是如此，代码开发者们为了隐藏目的，会在代码里加入各种多余的垃圾指令和代码，把原来的逻辑拆分成各种怪癖语法，从而达到防破解的目的。

如何做代码混淆？

讲到这里，你一定也好奇，代码混淆究竟是怎么做的？

对此，顶象移动安全总监Bob解释道：代码混淆主要有以下几方面工作：

1、代码中的包含各种元素，比如变量、函数、类的名字，这些名字有实际意义，直白的告诉破解者这个代码的功能用途．如果能改成无意义的名字，使得破解者阅读时无法根据名字猜测其功能用途；

2、良好的代码有着直白的代码逻辑，破解者阅读时可以轻易的反推出功能用途．如果将它们变为功能上等价、但是更难理解的形式，比如将循环改为递归、精简中间变量等，破解者需要付出更高的代价才能明白其功能用途；

3、对于一些解释型的代码，比如JavaScript，通常以源代码的形式发布，代码有良好的格式并且包含注释直接描述了代码的功能用途．如果能打乱代码的格式，删除源码注释，删除空格，将多行代码挤到一行代码等，破解者将难以从源码中获取有效信息；

对代码的阅读通常需要借助一些逆向工具，比如IDA，JADX，JDGUI．如果能用某种方式让这些逆向工具失效，可以逼迫破解者使用效率地下的手工分析，　进而干扰反编译的工作。

一般而言，代码混淆的常见手段分为以下几种：

1、名称混淆

将有意义的类，字段、方法名称更改为无意义的字符串。生成的新名称越短，字节代码越小。在名称混淆的字节代码中，包，类，字段和方法名称已重命名，并且难以恢复原始名称。

2、代码缩减

删除代码中对运行无用的注释，空格，换行，回车，调试信息，行号等，可以减小代码体积同时降低代码中有效的信息量．

３、控制流混淆

用于if, switch, while,for等关键字，对代码进行细微的修改，模糊控制流，而不改变代码在运行时的行为。通常情况下，选择和循环等逻辑构造会被更改，因此它们不再具有直接等效的源代码。流模糊的字节码通常强制反编译器将一系列标签和非法的go to语句插入到它们生成的源代码中。

4、数据流混淆

对一些通用的计算，将其替换为等价的形式．比如a=b+c替换为a=b+1+c-1．

５、花指令

在正常的指令序列中添加一些指令，对运行时无害，但是会触发逆向工具的Bug，造成逆向工具崩溃，无法反汇编，无法反编译，功能异常等．

此外，还有异常混淆、字符串加密混淆、引用混淆等。

对于Java来说，常用的混淆工具如下：

1、yGuard

yGuard是一款免费的Java混淆器（非开源），它有Java和.NET两个版本。yGuard 完全免费，基于 Ant 任务运行，提供高可配置的混淆规则。

2、proguard

proguard是一个免费的 Java类文件的压缩，优化，混肴器。它删除没有用的类，字段，方法与属性。使字节码最大程度地优化，使用简短且无意义的名字来重命名类、字段和方法。

3、allatori

第二代Java混淆器。所谓第二代混淆器，不仅仅能进行字段混淆，还能实现流混淆。

代码混淆不等于加密

那么，混淆等同于加密吗？

答案当然是否定的。

加密顾名思义就是要在我们想要隐藏的东西上上锁，可以是一道锁，也可以是多道锁，而混淆则不同，在进行混淆处理时，信息将保持原样，只是以一种模糊的格式呈现出来，因为我们将其复杂性提高到不可能（或几乎不可能）被理解或解析的程度。

相对于加密而言，则进一步证明了代码混淆在防破解方面的高明之处。我们都知道，加密的东西必须解密才能使用，就像一把锁和一堆钥匙，总有一把钥匙可以成功打开锁，让你看到其中的逻辑，但代码混淆不同，虽然没有加密，但代码开发者们却让逆向工程师们一遍遍在破解的迷宫里来回转圈，干扰破解。

这就会导致两种情况：一种是逆向工程师死磕到底，一种是放弃破解转而去破解更容易破解的App，从而达到保护App 的效果。

当然，代码混淆并不能真正防止逆向工程，只能增加难度，对于安全性要求很高的场景，仅使用代码混淆并不能保证原始代码的安全。

并且，对于代码混淆而言被混淆的代码难于理解，因此调试以及除错也变得困难起来。开发人员通常需要保留原始的未混淆的代码用于调试。对于支持反射的语言，代码混淆有可能与反射发生冲突。

App 加固非一时之功

正如前文所说，代码混淆并不能真正防止逆向工程，总有拨开云雾的一天，仅使用代码混淆并不能保证原始代码的安全，也不能完成保证App 加固不被破解，此时就需要多方出手，为App 的防破解环境加筑更多城墙。

比如字符串加密、控制流平坦化、指令替换、符号混淆、混淆多样化、不透明谓词、防动态调试、防动态注入、HOOK检测、代码段检验、完整性校验等等多种技术手段。

对于App 加固而言，这从来都不是一件简单的事情，一方有难，八法支援才是保护App 不被破解的良方。

————————————————

拓展学习：

红队外网打点与情报收集策略——「业务安全大讲堂第二季·第1期」https://live.csdn.net/room/dingxiangtech/rBN4xrOp

查看全文

http://www.lryc.cn/news/7874.html

【拓展】基于机器学习的心脏病预测方法（14）——心脏病数据集补充

深度解读Webpack中的loader原理

2023年全国最新二级建造师精选真题及答案

为什么现代企业发展离不开CRM系统的助力

vb.net计算之.net core基础(1)-获取农历和天气

设计模式之代理模式详解和应用

JavaScript HTML DOM 节点列表

【音视频处理】码率、帧率越高越清晰？分辨率、像素、dpi之间是什么关系？码率的真实作用，I帧、B帧、P帧是什么

TripleCross：一款功能强大的Linux eBPF安全研究工具

2023最牛教程，手把手教你成为年薪30W的测试开发

“深度学习”学习日记。--ImageNet、VGG、ResNet

关于APP下载量提升的技巧

以“大数据”赋能产业链精准招商

内存泄漏检测组件 -- hook

Diffusion model(三): 公式结论

Angular笔记（二）组件

微信小程序｜基于小程序+C#制作一个超酷的个人简历

华为OD机试 - 最快到达医院的方法（Java JS Python）

92.【SpringCloud NetFilx】

[ahk]如何载入Scite的会话Session文件

MyISAM和InnoDb的区别

K8s管理应用生命周期-Deployment篇

类和对象（下）（二）

代码混淆究竟是什么？

如何做代码混淆？

代码混淆不等于加密

App 加固非一时之功

相关文章：