当前位置: 首页 > news >正文

让逆向工程师们头疼的代码混淆,就像永远也走不出的“浪浪山”

 

目录

代码混淆究竟是什么?

如何做代码混淆?

代码混淆不等于加密

App 加固非一时之功


“我想离开浪浪山。”

在数次尝试破解某个App 时,某个逆向工程师无奈感慨道。

 

逆向工程师顾名思义就是把一个个完整的软件逆推,还原成一段段代码,方便破解。

比如给他们一个手机App、电脑程序,用不了多久,他们就能逆推出程序的运行逻辑,找到其中的关键代码,篡改、破解、发现漏洞。

这其中最好的例子就是盗版软件。开发者们累死累活才写好的程序,分分钟就被人逆向破解,植入广告和木马,重新打包成盗版。

但逆向工程师并非是反面形象,亦有好坏之分,正义的逆向者只是做安全研究,而那些非正义的逆向者却拿着这项技能四处干坏事牟利。

因此,二者的对立也尤为明显,一方为了防破解使出浑身解数,一方为了破解绞尽脑汁。

今天,我们就来讲讲关于让非正义的逆向工程师们头疼的代码混淆。

代码混淆究竟是什么?

关于代码混淆,百度百科给出的解释是:代码混淆(Obfuscation)是将电脑程序的原始代码或机器代码,转换成功能上等价,但是难于被人阅读和理解的行为。混淆后的代码,会将原先有明确含义的类名、字段、函数等转为无意义的单词,这样对于计算机来说,执行逻辑还是正常的,但是当人们去分析混淆后的代码时,会加大阅读和理解的难度,以此来加强代码的保护。

什么意思呢?

我们可以简单理解为代码开发者是想给破解者(逆向工程师)制造一个假象,从而让他们从其他角度去尝试破解,但破解之后发现方向是错的,便又需要重新找角度破解,增加破解难度,也给开发者们充分时间来对抗破解。

举个例子。

你想去超市买水果,但又不想让人知道,于是你先去买了卫生纸回来,又去了健身房,然后又去超市买了可乐,最后才去超市买了水果。

这样一来,别人对你的行动目的就不是明确的,需要多次猜测推理才能知道你的目的。代码混淆的逻辑便是如此,代码开发者们为了隐藏目的,会在代码里加入各种多余的垃圾指令和代码,把原来的逻辑拆分成各种怪癖语法,从而达到防破解的目的。

如何做代码混淆?

讲到这里,你一定也好奇,代码混淆究竟是怎么做的?

对此,顶象移动安全总监Bob解释道:代码混淆主要有以下几方面工作:

1、代码中的包含各种元素,比如变量、函数、类的名字,这些名字有实际意义,直白的告诉破解者这个代码的功能用途.如果能改成无意义的名字,使得破解者阅读时无法根据名字猜测其功能用途;

2、良好的代码有着直白的代码逻辑,破解者阅读时可以轻易的反推出功能用途.如果将它们变为功能上等价、但是更难理解的形式,比如将循环改为递归、精简中间变量等,破解者需要付出更高的代价才能明白其功能用途;

3、对于一些解释型的代码,比如JavaScript,通常以源代码的形式发布,代码有良好的格式并且包含注释直接描述了代码的功能用途.如果能打乱代码的格式,删除源码注释,删除空格,将多行代码挤到一行代码等,破解者将难以从源码中获取有效信息;

对代码的阅读通常需要借助一些逆向工具,比如IDA,JADX,JDGUI.如果能用某种方式让这些逆向工具失效,可以逼迫破解者使用效率地下的手工分析, 进而干扰反编译的工作。

一般而言,代码混淆的常见手段分为以下几种:

1、名称混淆

将有意义的类,字段、方法名称更改为无意义的字符串。生成的新名称越短,字节代码越小。在名称混淆的字节代码中,包,类,字段和方法名称已重命名,并且难以恢复原始名称。

2、代码缩减

删除代码中对运行无用的注释,空格,换行,回车,调试信息,行号等,可以减小代码体积同时降低代码中有效的信息量.

3、控制流混淆

用于if, switch, while,for等关键字,对代码进行细微的修改,模糊控制流,而不改变代码在运行时的行为。通常情况下,选择和循环等逻辑构造会被更改,因此它们不再具有直接等效的源代码。流模糊的字节码通常强制反编译器将一系列标签和非法的go to语句插入到它们生成的源代码中。

4、数据流混淆

对一些通用的计算,将其替换为等价的形式.比如a=b+c替换为a=b+1+c-1.

5、花指令

在正常的指令序列中添加一些指令,对运行时无害,但是会触发逆向工具的Bug,造成逆向工具崩溃,无法反汇编,无法反编译,功能异常等.

此外,还有异常混淆、字符串加密混淆、引用混淆等。

对于Java来说,常用的混淆工具如下:

1、yGuard

yGuard是一款免费的Java混淆器(非开源),它有Java和.NET两个版本。yGuard 完全免费,基于 Ant 任务运行,提供高可配置的混淆规则。

2、proguard

proguard是一个免费的 Java类文件的压缩,优化,混肴器。它删除没有用的类,字段,方法与属性。使字节码最大程度地优化,使用简短且无意义的名字来重命名类、字段和方法。

3、allatori

第二代Java混淆器。所谓第二代混淆器,不仅仅能进行字段混淆,还能实现流混淆。

代码混淆不等于加密

那么,混淆等同于加密吗?

答案当然是否定的。

加密顾名思义就是要在我们想要隐藏的东西上上锁,可以是一道锁,也可以是多道锁,而混淆则不同,在进行混淆处理时,信息将保持原样,只是以一种模糊的格式呈现出来,因为我们将其复杂性提高到不可能(或几乎不可能)被理解或解析的程度。

相对于加密而言,则进一步证明了代码混淆在防破解方面的高明之处。我们都知道,加密的东西必须解密才能使用,就像一把锁和一堆钥匙,总有一把钥匙可以成功打开锁,让你看到其中的逻辑,但代码混淆不同,虽然没有加密,但代码开发者们却让逆向工程师们一遍遍在破解的迷宫里来回转圈,干扰破解。

这就会导致两种情况:一种是逆向工程师死磕到底,一种是放弃破解转而去破解更容易破解的App,从而达到保护App 的效果。

当然,代码混淆并不能真正防止逆向工程,只能增加难度,对于安全性要求很高的场景,仅使用代码混淆并不能保证原始代码的安全。

并且,对于代码混淆而言被混淆的代码难于理解,因此调试以及除错也变得困难起来。开发人员通常需要保留原始的未混淆的代码用于调试。对于支持反射的语言,代码混淆有可能与反射发生冲突。

App 加固非一时之功

正如前文所说,代码混淆并不能真正防止逆向工程,总有拨开云雾的一天,仅使用代码混淆并不能保证原始代码的安全,也不能完成保证App 加固不被破解,此时就需要多方出手,为App 的防破解环境加筑更多城墙。

比如字符串加密、控制流平坦化、指令替换、符号混淆、混淆多样化、不透明谓词、防动态调试、防动态注入、HOOK检测、代码段检验、完整性校验等等多种技术手段。

对于App 加固而言,这从来都不是一件简单的事情,一方有难,八法支援才是保护App 不被破解的良方。

————————————————

拓展学习:

红队外网打点与情报收集策略——「业务安全大讲堂第二季·第1期」icon-default.png?t=N176https://live.csdn.net/room/dingxiangtech/rBN4xrOp

http://www.lryc.cn/news/7874.html

相关文章:

  • 【拓展】基于机器学习的心脏病预测方法(14)——心脏病数据集补充
  • 深度解读Webpack中的loader原理
  • 2023年全国最新二级建造师精选真题及答案
  • 为什么现代企业发展离不开CRM系统的助力
  • vb.net计算之.net core基础(1)-获取农历和天气
  • 设计模式之代理模式详解和应用
  • JavaScript HTML DOM 节点列表
  • 【音视频处理】码率、帧率越高越清晰?分辨率、像素、dpi之间是什么关系?码率的真实作用,I帧、B帧、P帧是什么
  • Java基础-认识注释、标识符关键字
  • 【C#】静态扩展方法
  • 医疗电子方案——血压计方案
  • 深度分析React源码中的合成事件
  • 17.微服务SpringCloud
  • Java基础面试题——JavaWeb专题
  • MySql数据库约束
  • TripleCross:一款功能强大的Linux eBPF安全研究工具
  • 2023最牛教程,手把手教你成为年薪30W的测试开发
  • “深度学习”学习日记。--ImageNet、VGG、ResNet
  • 关于APP下载量提升的技巧
  • 以“大数据”赋能产业链精准招商
  • 内存泄漏检测组件 -- hook
  • Diffusion model(三): 公式结论
  • Angular笔记(二)组件
  • 微信小程序|基于小程序+C#制作一个超酷的个人简历
  • 华为OD机试 - 最快到达医院的方法(Java JS Python)
  • 92.【SpringCloud NetFilx】
  • [ahk]如何载入Scite的会话Session文件
  • MyISAM和InnoDb的区别
  • K8s管理应用生命周期-Deployment篇
  • 类和对象(下)(二)