關注倉庫,及時獲得更新:iOS-Source-Code-Analyze
由於 Objective-C 中的內存管理是一個比較大的話題,所以會分為兩篇文章來對內存管理中的一些機制進行剖析,一部分分析自動釋放池以及 autorelease 方法,另一部分分析 retain、release 方法的實現以及自動引用計數。
寫在前面
這篇文章會在源代碼層面介紹 Objective-C 中自動釋放池,以及方法的 autorelease 的具體實現。
從 main 函數開始
main 函數可以說是在整個 iOS 開發中非常不起眼的一個函數,它很好地隱藏在 Supporting Files 文件夾中,卻是整個 iOS 應用的入口。
main.m 文件中的內容是這樣的: int main(int argc, char * argv[]) { @autoreleasepool { return UIApplicationMain(argc, argv, nil, NSStringFromClass([AppDelegate class])); } }
在這個 @autoreleasepool block 中只包含了一行代碼,這行代碼將所有的事件、消息全部交給了 UIApplication 來處理,但是這不是本文關注的重點。
需要注意的是:整個 iOS 的應用都是包含在一個自動釋放池 block 中的。
@autoreleasepool
@autoreleasepool 到底是什麼?我們在命令行中使用 clang -rewrite-objc main.m 讓編譯器重新改寫這個文件:
$ clang -rewrite-objc main.m
在生成了一大堆警告之後,當前目錄下多了一個 main.cpp 文件
這裡刪除了 main 函數中其他無用的代碼。
在這個文件中,有一個非常奇怪的 __AtAutoreleasePool 的結構體,前面的注釋寫到 /* @autoreleasepool */。也就是說 @autoreleasepool {} 被轉換為一個 __AtAutoreleasePool 結構體:
{ __AtAutoreleasePool __autoreleasepool; }
想要弄清楚這行代碼的意義,我們要在 main.cpp 中查找名為 __AtAutoreleasePool 的結構體:
struct __AtAutoreleasePool { __AtAutoreleasePool() {atautoreleasepoolobj = objc_autoreleasePoolPush();} ~__AtAutoreleasePool() {objc_autoreleasePoolPop(atautoreleasepoolobj);} void * atautoreleasepoolobj; };
這個結構體會在初始化時調用 objc_autoreleasePoolPush() 方法,會在析構時調用 objc_autoreleasePoolPop 方法。
這表明,我們的 main 函數在實際工作時其實是這樣的:
int main(int argc, const char * argv[]) { { void * atautoreleasepoolobj = objc_autoreleasePoolPush(); // do whatever you want objc_autoreleasePoolPop(atautoreleasepoolobj); } return 0; }
@autoreleasepool 只是幫助我們少寫了這兩行代碼而已,讓代碼看起來更美觀,然後要根據上述兩個方法來分析自動釋放池的實現。
AutoreleasePool 是什麼
這一節開始分析方法 objc_autoreleasePoolPush 和 objc_autoreleasePoolPop 的實現:
void *objc_autoreleasePoolPush(void) { return AutoreleasePoolPage::push(); } void objc_autoreleasePoolPop(void *ctxt) { AutoreleasePoolPage::pop(ctxt); }
上面的方法看上去是對 AutoreleasePoolPage 對應靜態方法 push 和 pop 的封裝。
這一小節會按照下面的順序逐步解析代碼中的內容:
AutoreleasePoolPage 的結構
objc_autoreleasePoolPush 方法
objc_autoreleasePoolPop 方法
AutoreleasePoolPage 的結構
AutoreleasePoolPage 是一個 C++ 中的類:
它在 NSObject.mm 中的定義是這樣的:
class AutoreleasePoolPage { magic_t const magic; id *next; pthread_t const thread; AutoreleasePoolPage * const parent; AutoreleasePoolPage *child; uint32_t const depth; uint32_t hiwat; };
magic 用於對當前 AutoreleasePoolPage 完整性的校驗
thread 保存了當前頁所在的線程
每一個自動釋放池都是由一系列的 AutoreleasePoolPage 組成的,並且每一個 AutoreleasePoolPage 的大小都是 4096 字節(16 進制 0x1000)
#define I386_PGBYTES 4096 #define PAGE_SIZE I386_PGBYTES
雙向鏈表
自動釋放池中的 AutoreleasePoolPage 是以雙向鏈表的形式連接起來的:
parent 和 child 就是用來構造雙向鏈表的指針。
自動釋放池中的棧
如果我們的一個 AutoreleasePoolPage 被初始化在內存的 0x100816000 ~ 0x100817000 中,它在內存中的結構如下:
其中有 56 bit 用於存儲 AutoreleasePoolPage 的成員變量,剩下的 0x100816038 ~ 0x100817000 都是用來存儲加入到自動釋放池中的對象。
begin() 和 end() 這兩個類的實例方法幫助我們快速獲取 0x100816038 ~ 0x100817000 這一范圍的邊界地址。
next 指向了下一個為空的內存地址,如果 next 指向的地址加入一個 object,它就會如下圖所示移動到下一個為空的內存地址中:
關於 hiwat 和 depth 在文章中並不會進行介紹,因為它們並不影響整個自動釋放池的實現,也不在關鍵方法的調用棧中。
POOL_SENTINEL(哨兵對象)
到了這裡,你可能想要知道 POOL_SENTINEL 到底是什麼,還有它為什麼在棧中。
首先回答第一個問題: POOL_SENTINEL 只是 nil 的別名。
#define POOL_SENTINEL nil
在每個自動釋放池初始化調用 objc_autoreleasePoolPush 的時候,都會把一個 POOL_SENTINEL push 到自動釋放池的棧頂,並且返回這個 POOL_SENTINEL 哨兵對象。
int main(int argc, const char * argv[]) { { void * atautoreleasepoolobj = objc_autoreleasePoolPush(); // do whatever you want objc_autoreleasePoolPop(atautoreleasepoolobj); } return 0; }
上面的 atautoreleasepoolobj 就是一個 POOL_SENTINEL。
而當方法 objc_autoreleasePoolPop 調用時,就會向自動釋放池中的對象發送 release 消息,直到第一個 POOL_SENTINEL:
objc_autoreleasePoolPush 方法
了解了 POOL_SENTINEL,我們來重新回顧一下 objc_autoreleasePoolPush 方法:
void *objc_autoreleasePoolPush(void) { return AutoreleasePoolPage::push(); }
它調用 AutoreleasePoolPage 的類方法 push,也非常簡單:
static inline void *push() { return autoreleaseFast(POOL_SENTINEL); }
在這裡會進入一個比較關鍵的方法 autoreleaseFast,並傳入哨兵對象 POOL_SENTINEL:
static inline id *autoreleaseFast(id obj) { AutoreleasePoolPage *page = hotPage(); if (page && !page->full()) { return page->add(obj); } else if (page) { return autoreleaseFullPage(obj, page); } else { return autoreleaseNoPage(obj); } }
上述方法分三種情況選擇不同的代碼執行:
有 hotPage 並且當前 page 不滿
調用 page->add(obj) 方法將對象添加至 AutoreleasePoolPage 的棧中
有 hotPage 並且當前 page 已滿
調用 autoreleaseFullPage 初始化一個新的頁
調用 page->add(obj) 方法將對象添加至 AutoreleasePoolPage 的棧中
無 hotPage
調用 autoreleaseNoPage 創建一個 hotPage
調用 page->add(obj) 方法將對象添加至 AutoreleasePoolPage 的棧中
最後的都會調用 page->add(obj) 將對象添加到自動釋放池中。
hotPage 可以理解為當前正在使用的 AutoreleasePoolPage。
page->add 添加對象
id *add(id obj) 將對象添加到自動釋放池頁中:
id *add(id obj) { id *ret = next; *next = obj; next++; return ret; }
筆者對這個方法進行了處理,更方便理解。
這個方法其實就是一個壓棧的操作,將對象加入 AutoreleasePoolPage 然後移動棧頂的指針。
autoreleaseFullPage(當前 hotPage 已滿)
autoreleaseFullPage 會在當前的 hotPage 已滿的時候調用:
static id *autoreleaseFullPage(id obj, AutoreleasePoolPage *page) { do { if (page->child) page = page->child; else page = new AutoreleasePoolPage(page); } while (page->full()); setHotPage(page); return page->add(obj); }
它會從傳入的 page 開始遍歷整個雙向鏈表,直到:
查找到一個未滿的 AutoreleasePoolPage
使用構造器傳入 parent 創建一個新的 AutoreleasePoolPage
在查找到一個可以使用的 AutoreleasePoolPage 之後,會將該頁面標記成 hotPage,然後調動上面分析過的 page->add 方法添加對象。
autoreleaseNoPage(沒有 hotPage)
如果當前內存中不存在 hotPage,就會調用 autoreleaseNoPage 方法初始化一個
AutoreleasePoolPage: static id *autoreleaseNoPage(id obj) { AutoreleasePoolPage *page = new AutoreleasePoolPage(nil); setHotPage(page); if (obj != POOL_SENTINEL) { page->add(POOL_SENTINEL); } return page->add(obj); }
既然當前內存中不存在 AutoreleasePoolPage,就要從頭開始構建這個自動釋放池的雙向鏈表,也就是說,新的 AutoreleasePoolPage 是沒有 parent 指針的。
初始化之後,將當前頁標記為 hotPage,然後會先向這個 page 中添加一個 POOL_SENTINEL 對象,來確保在 pop 調用的時候,不會出現異常。
最後,將 obj 添加到自動釋放池中。
objc_autoreleasePoolPop 方法
同樣,回顧一下上面提到的 objc_autoreleasePoolPop 方法:
void objc_autoreleasePoolPop(void *ctxt) { AutoreleasePoolPage::pop(ctxt); }
看起來傳入任何一個指針都是可以的,但是在整個工程並沒有發現傳入其他對象的例子。不過在這個方法中傳入其它的指針也是可行的,會將自動釋放池釋放到相應的位置。
我們一般都會在這個方法中傳入一個哨兵對象 POOL_SENTINEL,如下圖一樣釋放對象:
對 objc_autoreleasePoolPop 行為的測試
在繼續分析這個方法之前做一個小測試,在 objc_autoreleasePoolPop 傳入非哨兵對象,測試一下這個方法的行為。
下面是 main.m 文件中的源代碼:
#import int main(int argc, const char * argv[]) { @autoreleasepool { NSString *s = @"Draveness"; [s stringByAppendingString:@"-Suffix"]; } return 0; }
在代碼的這一行打一個斷點,因為這裡會調用 autorelease 方法,將字符串加入自動釋放池:
當代碼運行到這裡時,通過 lldb 打印出當前 hotPage 中的棧內容:
通過 static 方法獲取當前 hotPage
打印 AutoreleasePoolPage 中的內容
打印當前 next 指針指向的內容,以及之前的內容,-2時已經到了 begin() 位置
使用 print()和 printAll()打印自動釋放池中內容
然後將字符串 @"Draveness-Suffix" 的指針傳入 pop 方法,測試 pop 方法能否傳入非哨兵參數。
再次打印當前 AutoreleasePoolPage 的內容時,字符串已經不存在了,這說明向 pop 方法傳入非哨兵參數是可行的,只是我們一般不會傳入非哨兵對象。
讓我們重新回到對 objc_autoreleasePoolPop 方法的分析,也就是 AutoreleasePoolPage::pop 方法的調用:
static inline void pop(void *token) { AutoreleasePoolPage *page = pageForPointer(token); id *stop = (id *)token; page->releaseUntil(stop); if (page->child) { if (page->lessThanHalfFull()) { page->child->kill(); } else if (page->child->child) { page->child->child->kill(); } } }
在這個方法中刪除了大量無關的代碼,以及對格式進行了調整。
該靜態方法總共做了三件事情:
使用 pageForPointer 獲取當前 token 所在的 AutoreleasePoolPage
調用 releaseUntil 方法釋放棧中的對象,直到 stop
調用 child 的 kill 方法
我到現在也不是很清楚為什麼要根據當前頁的不同狀態 kill 掉不同 child 的頁面。
if (page->lessThanHalfFull()) { page->child->kill(); } else if (page->child->child) { page->child->child->kill(); }
pageForPointer 獲取 AutoreleasePoolPage
pageForPointer 方法主要是通過內存地址的操作,獲取當前指針所在頁的首地址:
static AutoreleasePoolPage *pageForPointer(const void *p) { return pageForPointer((uintptr_t)p); } static AutoreleasePoolPage *pageForPointer(uintptr_t p) { AutoreleasePoolPage *result; uintptr_t offset = p % SIZE; assert(offset >= sizeof(AutoreleasePoolPage)); result = (AutoreleasePoolPage *)(p - offset); result->fastcheck(); return result; }
將指針與頁面的大小,也就是 4096 取模,得到當前指針的偏移量,因為所有的 AutoreleasePoolPage 在內存中都是對齊的:
p = 0x100816048
p % SIZE = 0x48
result = 0x100816000
而最後調用的方法 fastCheck() 用來檢查當前的 result 是不是一個 AutoreleasePoolPage。
通過檢查 magic_t 結構體中的某個成員是否為 0xA1A1A1A1。
releaseUntil 釋放對象
releaseUntil 方法的實現如下:
void releaseUntil(id *stop) { while (this->next != stop) { AutoreleasePoolPage *page = hotPage(); while (page->empty()) { page = page->parent; setHotPage(page); } page->unprotect(); id obj = *--page->next; memset((void*)page->next, SCRIBBLE, sizeof(*page->next)); page->protect(); if (obj != POOL_SENTINEL) { objc_release(obj); } } setHotPage(this); }
它的實現還是很容易的,用一個 while 循環持續釋放 AutoreleasePoolPage 中的內容,直到 next 指向了 stop 。
使用 memset 將內存的內容設置成 SCRIBBLE,然後使用 objc_release 釋放對象。
kill() 方法
到這裡,沒有分析的方法就只剩下 kill 了,而它會將當前頁面以及子頁面全部刪除:
void kill() { AutoreleasePoolPage *page = this; while (page->child) page = page->child; AutoreleasePoolPage *deathptr; do { deathptr = page; page = page->parent; if (page) { page->unprotect(); page->child = nil; page->protect(); } delete deathptr; } while (deathptr != this); }
autorelease 方法
我們已經對自動釋放池生命周期有一個比較好的了解,最後需要了解的話題就是 autorelease 方法的實現,先來看一下方法的調用棧:
- [NSObject autorelease] └── id objc_object::rootAutorelease() └── id objc_object::rootAutorelease2() └── static id AutoreleasePoolPage::autorelease(id obj) └── static id AutoreleasePoolPage::autoreleaseFast(id obj) ├── id *add(id obj) ├── static id *autoreleaseFullPage(id obj, AutoreleasePoolPage *page) │ ├── AutoreleasePoolPage(AutoreleasePoolPage *newParent) │ └── id *add(id obj) └── static id *autoreleaseNoPage(id obj) ├── AutoreleasePoolPage(AutoreleasePoolPage *newParent) └── id *add(id obj)
在 autorelease 方法的調用棧中,最終都會調用上面提到的 autoreleaseFast 方法,將當前對象加到 AutoreleasePoolPage 中。
這一小節中這些方法的實現都非常容易,只是進行了一些參數上的檢查,最終還要調用 autoreleaseFast 方法:
inline id objc_object::rootAutorelease() { if (isTaggedPointer()) return (id)this; if (prepareOptimizedReturn(ReturnAtPlus1)) return (id)this; return rootAutorelease2(); } __attribute__((noinline,used)) id objc_object::rootAutorelease2() { return AutoreleasePoolPage::autorelease((id)this); } static inline id autorelease(id obj) { id *dest __unused = autoreleaseFast(obj); return obj; }
由於在上面已經分析過 autoreleaseFast 方法的實現,這裡就不會多說了。
小結
整個自動釋放池 AutoreleasePool 的實現以及 autorelease 方法都已經分析完了,我們再來回顧一下文章中的一些內容:
自動釋放池是由 AutoreleasePoolPage 以雙向鏈表的方式實現的
當對象調用 autorelease 方法時,會將對象加入 AutoreleasePoolPage 的棧中
調用 AutoreleasePoolPage::pop 方法會向棧中的對象發送 release 消息
參考資料
What is autoreleasepool? - Objective-C
Using Autorelease Pool Blocks
NSAutoreleasePool
黑幕背後的 Autorelease