Swift 内部机制浅析 已翻译 100%

jluflyingz 投递于 2014/06/18 10:06 (共 8 段, 翻译完成于 06-20)
阅读 2212
收藏 2
0
加载中

Swift是苹果公司最新推出的编程语言,据很多人说,是用来”代替“Objective-C。但是没有确切的证据。我花了一些时间对Swift二进制和运行环境实施逆向工程技术,然后我对Swift有些少许的发现。目前为止,结论就是:Swift是没有消息机制的Objective-C。

对象

信不信由你,Swift中的对象就是Objective-C的对象。在Mach-O二进制文件中,__objc_classlist包含每个二进制文件中类的数据。其结构如下所示:

struct objc_class {
    uint64_t isa;
    uint64_t superclass;
    uint64_t cache;
    uint64_t vtable;
    uint64_t data;
};

(注:所有结构都来自64位版本)

注意data记录,它指向了类中的一个列出方法、实例变量和协议等内容的结构体。通常,data是8个字节对齐的,但是对于Swift类,data的最后一位仅为1个字节。

0x0bject
0x0bject
翻译于 2014/06/18 15:33
2

Swift类的真正结构是有一点奇怪的。Swift类没有Objective-C方法。我们将在以后实现它。Swift类的变量存储为实例变量。Swift的getter和setter方法真正修改的是实例变量的值。奇怪的是swift类的实例变量没有类型编码。通常应该指向类型编码的指针为NULL。这大概是由于事实上Objective-C运行时是不支持处理Swift变量本身。

继承

Swift的继承是你所期待的。在Swift中,Square是shape的子类也是Objective-C类Shape的子类。然而,在Swift类中没有超类?

例如

class Shape { }

在这个例子中,Shape类是SwiftObject的子类。SwiftObject是一个根Objective-C类,类似于NSObject。它没有超类,意味着isa指向自身。它的目的是使用Swift运行时方法比如allocation和deallocation代替标准的Objective-C运行时方法。例如,(void)retain不会调用objc_retain,但是它会调用swift_retain。

地狱星星
地狱星星
翻译于 2014/06/19 00:07
1

类方法

就像我之前提到的,Swift对象的类没有方法,以此代替的是类似C++的函数,名称改编和所有东西。这可能是为什么Swift声称比Objective-C更快的原因。不再需要为 objc_msgSend  寻找和调用方法实现。

在Objective-C里面,方法像这样实现:

type method(id self, SEL _cmd, id arg1, id arg2, ...)

Swift 方法非常类似,但是轻微使用了不同的参数排布, self 作为最后一个参数传递,并且没有选择器。 

type method(id arg1, id arg2, ..., id self)

AndyLam
AndyLam
翻译于 2014/06/18 19:57
1

虚表

类似C++一样,Swift类也具有一个虚表,用于列出类中的方法。它直接被放置在二进制文件中的类数据之后,并且看起来是这样的:

struct swift_vtable_header {
    uint32_t vtable_size;
    uint32_t unknown_000;
    uint32_t unknown_001;
    uint32_t unknown_002;
    void* nominalTypeDescriptor;
    // vtable pointers
}

据我所知,Swift类中的虚表仅在编译期间可见时被使用。否则,它将看起来就是一堆乱糟糟的符号。

0x0bject
0x0bject
翻译于 2014/06/18 15:37
1

命名重整

Swift保持函数的元数据在各自的符号,这就叫做命名重整。元数据宝库奥函数的名称(显而易见的),属性,模块名称,参数类型,返回值类型,还有更多的数据,例如这个例子

class Shape{
    func numberOfSides() -> Int {
        return 5
    }
}

simpleDescription方法的重整命名是:

_TFC9swifttest5Shape17simpleDescriptionfS0_FT_Si。下面是详细说明:

_T - 所有Swift符号的前缀,每一个符号都是从_T开始。

F - 函数

C - 类的函数(方法)

9swifttest - 带有长度前缀的模块名

5Shape - 函数所属的类,带有长度前缀

17simpleDescription - 函数名

f - 函数属性。 在这个例子中它是f,这是一个普通函数。

S0_FT- 我不是特别确定这是什么意思,但是它是参数和返回类型开始的标记

‘_' - 这个下划线分割了参数和返回值的类型。因为函数没有带参数,它直接跟在了S0_FT的后面

S - 返回值的开始。'S'代表Swift;返回类型是Swift的内建类型,下一个字符决定了类型

i - 这是Swift的内建类型。一个小写的"I"代表了Int.

地狱星星
地狱星星
翻译于 2014/06/20 10:56
1

函数属性

字符类型

f        普通函数

s        setter

g        getter

d        析构函数

D        释放器

c        构造函数

C        分配器

Swift内部函数

字符类型

a        数组

b        布尔型

c        字符常量

d        双精度浮点数

f        单精度浮点型

i        整型

u        UInt类型

Q        隐式可选

S        字符串型

除了函数之外,还有很多命名转换机制,此处我仅给出一个简短的概述。

挂钩函数

受够了语义这部分,让我们接触点有趣的东西!比方说我们有一个像这样的类:

class Shape {
    var numberOfSides: Int;

    init(){
        numberOfSides = 5;
    }
}

比如我们想将numberOfSides的值改为4,很多种方法可以做到。我们可以使用MobileSubstrate挂到getter方法中,然后更改返回值,就像这样:

int (*numberOfSides)(id self);

MSHook(int, numberOfSides, id self){
    return 4;
}

%ctor{
    numberOfSides = (int (*)(id self)) dlsym(RTLD_DEFAULT, "_TFC9swifttest5Shapeg13numberOfSidesSi");
    MSHookFunction(numberOfSides, MSHake(numberOfSides));
}

如果我们创建了一个形状的实例,并且打印出numberOfSides的值,我们得到了4!看起来不错,对不?现在,我知道你可能在想,难道我们不应该是返回一个对象而非常量4吗?

0x0bject
0x0bject
翻译于 2014/06/19 09:12
1

好吧,在Swift里,许多内建类型是书面量来的。一个Int型, 举个例子,和C语言里面的int型一样(尽管它可以是一个长整形——不要让我碰到这种情况)。一个小小的提示,String 类型有点古老,这是一个低位优先的UTF-16字符串,所以没有C的字面量能用。

让我们来做同样的事情,但这一次,我们不是在获取器上,而是在获取器上设钩。

void (*setNumberOfSides)(int newNumber, id self);

MSHook(void, setNumberOfSides, int newNumber, id self){
    _setNumberOfSides(4, self);
}

%ctor {
    setNumberOfSides = (void (*)(int newNumber, id self)) dlsym(RTLD_DEFAULT, "_TFC9swifttest5Shapes13numberOfSidesSi");
    MSHookFunction(setNumberOfSides, MSHake(setNumberOfSides));
}

再尝试一下,然后。。。。。。还是5。怎么回事,你问?好吧,在Swift里某些地方,函数是内联化的。类构造器就是其中一个的地方。它直接设置numberOfSides 为ivar, 设置器将仅在数值再次被顶层代码设置的时候被调用。在那被调用,你知道么,我们得到了4。

AndyLam
AndyLam
翻译于 2014/06/19 10:14
1

最终,让我们通过直接设置实例变量的值来修改numberOfSides。

void (*setNumberOfSides)(int newNumber, id self);

MSHook(void, setNumberOfSides, int newNumber, id self){
    MSHookIvar<int>(self, "numberOfSides") = 4;
}

%ctor {
    setNumberOfSides = (void (*)(int newNumber, id self)) dlsym(RTLD_DEFAULT, "_TFC9swifttest5Shapes13numberOfSidesSi");
    MSHookFunction(setNumberOfSides, MSHake(setNumberOfSides));
}

这个函数是可以实现功能的,虽然不建议这样做,但是确实有效果。

这是目前我所要写的内容。当然,还有很多其他的内容我正在看,包括witness表,由于我了解不多,所以这里我也没办法写出总结。很多内容在这篇文章里有变更,他们仅是我目前对运行和查看用Swift语言编译的二进制文件逆向工程操作所得到的东西。

我所发现的东西应该是非常不错的,这意味着MobileSubstrate不会随着Objective-C一同消亡,并且,微调仍然可以进行!我很想知道将来在越狱场景下的应用商店中将会是怎样一番情景……难道logo可以更新用来自动销毁命名?甚至是处理常见的 Swift 类型的库……

如果你发现更多的关于Swift如何工作的东西,不要犹豫,请让我知道!

0x0bject
0x0bject
翻译于 2014/06/19 15:42
1
本文中的所有译文仅用于学习和交流目的,转载请务必注明文章译者、出处、和本文链接。
我们的翻译工作遵照 CC 协议,如果我们的工作有侵犯到您的权益,请及时联系我们。
加载中

评论(5)

宝贝颖
宝贝颖
Here
宝贝颖
宝贝颖
its
宝贝颖
宝贝颖
_
宝贝颖
宝贝颖
总能
宝贝颖
宝贝颖
contact
返回顶部
顶部