Ios教程網 >> IOS編程開發 >> IOS開發基礎 >> iOS多線程到底不安全在哪裡？

iOS多線程到底不安全在哪裡？

編輯：IOS開發基礎

iOS多線程安全的概念在很多地方都會遇到，為什麼不安全，不安全又該怎麼去定義，其實是個值得深究的話題。

共享狀態，多線程共同訪問某個對象的property，在iOS編程裡是很普遍的使用場景，我們就從Property的多線程安全說起。

Property

當我們討論property多線程安全的時候，很多人都知道給property加上atomic attribute之後，可以一定程度的保障多線程安全，類似：

@property (atomic, strong) NSString*                 userName;

事情並沒有看上去這麼簡單，要分析property在多線程場景下的表現，需要先對property的類型做區分。

我們可以簡單的將property分為值類型和對象類型，值類型是指primitive type，包括int, long, bool等非對象類型，另一種是對象類型，聲明為指針，可以指向某個符合類型定義的內存區域。

上述代碼中userName明顯是個對象類型，當我們訪問userName的時候，訪問的有可能是userName本身，也有可能是userName所指向的內存區域。

比如：

self.userName = @"peak";

是在對指針本身進行賦值。而

[self.userName rangeOfString:@"peak"];

是在訪問指針指向的字符串所在的內存區域，這二者並不一樣。

所以我們可以大致上將property分為三類：

分完類之後，我們需要明白這三類property的內存模型。

Memory Layout

當我們討論多線程安全的時候，其實是在討論多個線程同時訪問一個內存區域的安全問題。針對同一塊區域，我們有兩種操作，讀（load）和寫（store），讀和寫同時發生在同一塊區域的時候，就有可能出現多線程不安全。所以展開討論之前，先要明白上述三種property的內存模型，可用如下圖示：

以64位系統為例，指針NSString*是8個字節的內存區域，int count是個4字節的區域，而@“Peak”是一塊根據字符串長度而定的內存區域。

當我們訪問property的時候，實際上是訪問上圖中三塊內存區域。

self.userName = @"peak";

是修改第一塊區域。

self.count = 10;

是在修改第二塊區域。

[self.userName rangeOfString:@"peak"];

是在讀取第三塊區域。

不安全的定義

明白了property的類型以及他們對應的內存模型，我們再來看看不安全的定義。Wikipedia如是說：

A piece of code is thread-safe if it manipulates shared data structures only in a manner that guarantees safe execution by multiple threads at the same time

這段定義看起來還是有點抽象，我們可以將多線程不安全解釋為：多線程訪問時出現意料之外的結果。這個意料之外的結果包含幾種場景，不一定是指crash，後面再一一分析。

先來看下多線程是如何同時訪問內存的。不考慮CPU cache對變量的緩存，內存訪問可以用下圖表示：

從上圖中可以看出，我們只有一個地址總線，一個內存。即使是在多線程的環境下，也不可能存在兩個線程同時訪問同一塊內存區域的場景，內存的訪問一定是通過一個地址總線串行排隊訪問的，所以在繼續後續之前，我們先要明確幾個結論：

結論一：內存的訪問時串行的，並不會導致內存數據的錯亂或者應用的crash。

結論二：如果讀寫（load or store）的內存長度小於等於地址總線的長度，那麼讀寫的操作是原子的，一次完成。比如bool，int，long在64位系統下的單次讀寫都是原子操作。

接下來我們根據上面三種property的分類逐一看下多線程的不安全場景。

值類型Property

先以BOOL值類型為例，當我們有兩個線程訪問如下property的時候：

@property (nonatomic, assgin) BOOL    isDeleted;

//thread 1
bool isDeleted = self.isDeleted;

//thread 2
self.isDeleted = false;

線程1和線程2，一個讀(load)，一個寫(store)，對於BOOL isDeleted的訪問可能有先後之分，但一定是串行排隊的。而且由於BOOL大小只有1個字節，64位系統的地址總線對於讀寫指令可以支持8個字節的長度，所以對於BOOL的讀和寫操作我們可以認為是原子的，所以當我們聲明BOOL類型的property的時候，從原子性的角度看，使用atomic和nonatomic並沒有實際上的區別（當然如果重載了getter方法就另當別論了）。

如果是int類型呢？

@property (nonatomic, assgin) int    count;

//thread 1
int curCount = self.count;

//thread 2
self.count = 1;

同理int類型長度為4字節，讀和寫都可以通過一個指令完成，所以理論上讀和寫操作都是原子的。從訪問內存的角度看nonatomic和atomic也並沒有什麼區別。

atomic到底有什麼用呢？據我所知，用處有二：

用處一：生成原子操作的getter和setter。

設置atomic之後，默認生成的getter和setter方法執行是原子的。也就是說，當我們在線程1執行getter方法的時候（創建調用棧，返回地址，出棧），線程B如果想執行setter方法，必須先等getter方法完成才能執行。舉個例子，在32位系統裡，如果通過getter返回64位的double，地址總線寬度為32位，從內存當中讀取double的時候無法通過原子操作完成，如果不通過atomic加鎖，有可能會在讀取的中途在其他線程發生setter操作，從而出現異常值。如果出現這種異常值，就發生了多線程不安全。

用處二：設置Memory Barrier

對於Objective C的實現來說，幾乎所有的加鎖操作最後都會設置memory barrier，atomic本質上是對getter，setter加了鎖，所以也會設置memory barrier。官方文檔表述如下：

Note: Most types of locks also incorporate a memory barrier to ensure that any preceding load and store instructions are completed before entering the critical section.

memory barrier有什麼用處呢？

memory barrier能夠保證內存操作的順序，按照我們代碼的書寫順序來。聽起來有點不可思議，事實是編譯器會對我們的代碼做優化，在它認為合理的場景改變我們代碼最終翻譯成的機器指令順序。也就是說如下代碼：

self.intA = 0;  //line 1
self.intB = 1; //line 2

編譯器可能在一些場景下先執行line2，再執行line1，因為它認為A和B之間並不存在依賴關系，雖然在代碼執行的時候，在另一個線程intA和intB存在某種依賴，必須要求line1先於line2執行。

如果設置property為atomic，也就是設置了memory barrier之後，就能夠保證line1的執行一定是先於line2的，當然這種場景非常罕見，一則是出現變量跨線程訪問依賴，二是遇上編譯器的優化，兩個條件缺一不可。這種極端的場景下，atomic確實可以讓我們的代碼更加多線程安全一點，但我寫iOS代碼至今，還未遇到過這種場景，較大的可能性是編譯器已經足夠聰明，在我們需要的地方設置memory barrier了。

是不是使用了atomic就一定多線程安全呢？我們可以看看如下代碼：

@property (atomic, assign)    int       intA;

//thread A
for (int i = 0; i < 10000; i ++) {
    self.intA = self.intA + 1;
    NSLog(@"Thread A: %d\n", self.intA);
}

//thread B
for (int i = 0; i < 10000; i ++) {
    self.intA = self.intA + 1;
    NSLog(@"Thread B: %d\n", self.intA);
}

即使我將intA聲明為atomic，最後的結果也不一定會是20000。原因就是因為self.intA = self.intA + 1;不是原子操作，雖然intA的getter和setter是原子操作，但當我們使用intA的時候，整個語句並不是原子的，這行賦值的代碼至少包含讀取(load)，+1(add)，賦值(store)三步操作，當前線程store的時候可能其他線程已經執行了若干次store了，導致最後的值小於預期值。這種場景我們也可以稱之為多線程不安全。

指針Property

指針Property一般指向一個對象，比如：

@property (atomic, strong) NSString*                 userName;

無論iOS系統是32位系統還是64位，一個指針的值都能通過一個指令完成load或者store。但和primitive type不同的是，對象類型還有內存管理的相關操作。在MRC時代，系統默認生成的setter類似如下：

- (void)setUserName:(NSString *)userName {
    if(_uesrName != userName) {
        [userName retain];
        [_userName release];
        _userName = userName;
    }
}

不僅僅是賦值操作，還會有retain，release調用。如果property為nonatomic，上述的setter方法就不是原子操作，我們可以假設一種場景，線程1先通過getter獲取當前_userName，之後線程2通過setter調用[_userName release];，線程1所持有的_userName就變成無效的地址空間了，如果再給這個地址空間發消息就會導致crash，出現多線程不安全的場景。

到了ARC時代，Xcode已經替我們處理了retain和release，絕大部分時候我們都不需要去關心內存的管理，但retain，release其實還是存在於最後運行的代碼當中，atomic和nonatomic對於對象類的property聲明理論上還是存在差異，不過我在實際使用當中，將NSString*設置為nonatomic也從未遇到過上述多線程不安全的場景，極有可能ARC在內存管理上的優化已經將上述場景處理過了，所以我個人覺得，如果只是對對象類property做read，write，atomic和nonatomic在多線程安全上並沒有實際差別。

指針Property指向的內存區域

這一類多線程的訪問場景是我們很容易出錯的地方，即使我們聲明property為atomic，依然會出錯。因為我們訪問的不是property的指針區域，而是property所指向的內存區域。可以看如下代碼：

@property (atomic, strong) NSString*                 stringA;

//thread A
for (int i = 0; i < 100000; i ++) {
    if (i % 2 == 0) {
        self.stringA = @"a very long string";
    }
    else {
        self.stringA = @"string";
    }
    NSLog(@"Thread A: %@\n", self.stringA);
}

//thread B
for (int i = 0; i < 100000; i ++) {
    if (self.stringA.length >= 10) {
        NSString* subStr = [self.stringA substringWithRange:NSMakeRange(0, 10)];
    }
    NSLog(@"Thread B: %@\n", self.stringA);
}

雖然stringA是atomic的property，而且在取substring的時候做了length判斷，線程B還是很容易crash，因為在前一刻讀length的時候self.stringA = @"a very long string";，下一刻取substring的時候線程A已經將self.stringA = @"string";，立即出現out of bounds的Exception，crash，多線程不安全。

同樣的場景還存在對集合類操作的時候，比如：

@property (atomic, strong) NSArray*                 arr;

//thread A
for (int i = 0; i < 100000; i ++) {
    if (i % 2 == 0) {
        self.arr = @[@"1", @"2", @"3"];
    }
    else {
        self.arr = @[@"1"];
    }
    NSLog(@"Thread A: %@\n", self.arr);
}

//thread B
for (int i = 0; i < 100000; i ++) {
    if (self.arr.count >= 2) {
        NSString* str = [self.arr objectAtIndex:1];
    }
    NSLog(@"Thread B: %@\n", self.arr);
}

同理，即使我們在訪問objectAtIndex之前做了count的判斷，線程B依舊很容易crash，原因也是由於前後兩行代碼之間arr所指向的內存區域被其他線程修改了。

所以你看，真正需要操心的是這一類內存區域的訪問，即使聲明為atomic也沒有用，我們平常App出現莫名其妙難以重現的多線程crash多是屬於這一類，一旦在多線程的場景下訪問這類內存區域的時候，要提起十二分的小心。如何避免這類crash後面會談到。

Property多線程安全小結：

簡而言之，atomic的作用只是給getter和setter加了個鎖，atomic只能保證代碼進入getter或者setter函數內部時是安全的，一旦出了getter和setter，多線程安全只能靠程序員自己保障了。所以atomic屬性和使用property的多線程安全並沒什麼直接的聯系。另外，atomic由於加鎖也會帶來一些性能損耗，所以我們在編寫iOS代碼的時候，一般聲明property為nonatomic，在需要做多線程安全的場景，自己去額外加鎖做同步。

如何做到多線程安全？

討論到這裡，其實怎麼做到多線程安全也比較明朗了，關鍵字是atomicity（原子性），只要做到原子性，小到一個primitive type變量的訪問，大到一長段代碼邏輯的執行，原子性能保證代碼串行的執行，能保證代碼執行到一半的時候，不會有另一個線程介入。

原子性是個相對的概念，它所針對的對象，粒度可大可小。

比如下段代碼：

if (self.stringA.length >= 10) {
    NSString* subStr = [self.stringA substringWithRange:NSMakeRange(0, 10)];
}

是非原子性的。

但加鎖以後：

//thread A
[_lock lock];
for (int i = 0; i < 100000; i ++) {
    if (i % 2 == 0) {
        self.stringA = @"a very long string";
    }
    else {
        self.stringA = @"string";
    }
    NSLog(@"Thread A: %@\n", self.stringA);
}
[_lock unlock];

//thread B
[_lock lock];
if (self.stringA.length >= 10) {
    NSString* subStr = [self.stringA substringWithRange:NSMakeRange(0, 10)];
}
[_lock unlock];

整段代碼就具有原子性了，就可以認為是多線程安全了。

再比如：

if (self.arr.count >= 2) {
    NSString* str = [self.arr objectAtIndex:1];
}

是非原子性的。

而

//thread A
[_lock lock];
for (int i = 0; i < 100000; i ++) {
    if (i % 2 == 0) {
        self.arr = @[@"1", @"2", @"3"];
    }
    else {
        self.arr = @[@"1"];
    }
    NSLog(@"Thread A: %@\n", self.arr);
}
[_lock unlock];
    
//thread B
[_lock lock];
if (self.arr.count >= 2) {
    NSString* str = [self.arr objectAtIndex:1];
}
[_lock unlock];

是具有原子性的。注意，讀和寫都需要加鎖。

這也是為什麼我們在做多線程安全的時候，並不是通過給property加atomic關鍵字來保障安全，而是將property聲明為nonatomic（nonatomic沒有getter，setter的鎖開銷），然後自己加鎖。

如何使用哪種鎖？

iOS給代碼加鎖的方式有很多種，常用的有：

@synchronized(token)
NSLock
dispatch_semaphore_t
OSSpinLock

這幾種鎖都可以帶來原子性，性能的損耗從上至下依次更小。

我個人建議是，在編寫應用層代碼的時候，除了OSSpinLock之外，哪個順手用哪個。相較於這幾個鎖的性能差異，代碼邏輯的正確性更為重要。而且這幾者之間的性能差異對用戶來說，絕大部分時候都感知不到。

當然我們也會遇到少數場景需要追求代碼的性能，比如編寫framework，或者在多線程讀寫共享數據頻繁的場景，我們需要大致了解鎖帶來的損耗到底有多少。

官方文檔有個數據，使用Intel-based iMac with a 2 GHz Core Duo processor and 1 GB of RAM running OS X v10.5測試，獲取mutex有大概0.2ms的損耗，我們可以認為鎖帶來的損耗大致在ms級別。

Atomic Operations

其實除了各種鎖之外，iOS上還有另一種辦法來獲取原子性，使用Atomic Operations，相比鎖的損耗要小一個數量級左右，在一些追求高性能的第三方Framework代碼裡可以看到這些Atomic Operations的使用。這些atomic operation可以在/usr/include/libkern/OSAtomic.h中查到：