Core Image：更強的性能並支持基於 Python 快速開發

2018-06-09 15:49:10 繁華落盡and曲終人散

相信絕大多數 iOS 開發者對 Core Image 都不陌生，作為系統標配的、異常強大的圖像處理庫，在絕大多數場景下都能滿足 App 的圖像處理需求。加上目前 Core Image 已經支持在 iOS 上也能做自定義 filter，使得其已經成為流行的圖像處理框架 GPUImage 最強大的競爭對手。加上 iOS12 蘋果打算 deprecate OpenGL 和 OpenGL ES, 推廣 Metal。那和 Metal 聯繫緊密的 Core Image 無疑更有勝算。

這個 Session 講的內容主要包括三個部分：

Core Image 新的性能 API；
在 Core Image 體系上快速搭建濾鏡原型；
在 Core Image 體系上應用機器學習；

1. Core Image 新的性能 API

中間緩存

在講中間緩存之前，需要先複習一下 Core Image。在 Core Image 中，我們能夠對圖像鏈式的執行 Filter，如下圖所示：

func applyFilterChain(to image: CIImage) -> CIImage { // The CIPhotoEffectInstant filter takes only an input image let colorFilter = CIFilter(name: "CIPhotoEffectProcess", withInputParameters: [kCIInputImageKey: image])!  // Pass the result of the color filter into the Bloom filter // and set its parameters for a glowy effect. let bloomImage = colorFilter.outputImage!.applyingFilter("CIBloom", withInputParameters: [ kCIInputRadiusKey: 10.0, kCIInputIntensityKey: 1.0 ])  // imageByCroppingToRect is a convenience method for // creating the CICrop filter and accessing its outputImage. let cropRect = CGRect(x: 350, y: 350, width: 150, height: 150) let croppedImage = bloomImage.cropping(to: cropRect)  return croppedImage}

整個過程很直觀，我們將圖片喂到第一個 Filter，然後得到第一個 Filter 的 outputImage ，然後再把該對象喂到第二個 Filter……以此類推建立 Filter 鏈。

Core Image 的 Lazy

值得注意的一點是，當上述代碼執行時，圖像處理並沒有發生，只是 Core Image 內部進行了一些關係的建立，只有當圖像需要被渲染的時候，才會實際去執行各個 Filter 的圖像處理過程。

因為有 Lazy 的特性，所以 Core Image 上最重要的一個優化就是 "自動連接(Filter Concatenation)", 因為最終圖像處理的過程都發生在所有 Filter 成鏈之後。所以 Core Image 可以將鏈式的多個 Filter 合併成一個來執行，省去不必要的開銷。如下圖所示：

中間緩存

現在回過頭來看這樣一個場景：

三個 Filter，第一個計算很耗時，而第三個的參數可以讓用戶手動調節。這意味著每次用戶調節後都需要重新計算這三個 Filter。但其實前兩份 Filter 的參數是不變的，也就是說前兩個 Filter 的運算過程和結果都是不隨著用戶調整第三個 Filter 的參數改變而改變的。這裡重複的計算是否有可能進行優化呢？

我們很容易就想到，我們只需要把前兩次運算的結果 cache 下來就可以了，如下圖所示：

但是上文提到，Core Image 會把 Filter 鏈自動合併為一個 Filter，我們如何訪問中間結果呢？

蘋果在 iOS12的 Core Image 中，給 CIImage 新增了一箇中間緩存的屬性( insertingIntermediate ), 來解決這個問題，如下圖所示：

我們希望保存第二個 Filter 的結果，只需要在第二個 Filter 的 outputImage 調用 insertingIntermediate() 來生成一個新的 CIImage 傳到後面的流程即可。這樣第三個 Filter 的參數調整就不會導致前兩個 Filter 的重複計算。

怎麼做的呢? 其實就是自動合併的邏輯會根據 insertingIntermediate 進行調整。如下圖所示：

Core Image 的 CIContext 可以設置是否要打開 cacheIntermediate , 但這次新增的 insertingIntermediate 有更高的優先級。具體一些使用上的建議可以參考下圖：

Kernal 語言的新特性

兩種模式

iOS 上支持自定義 Filter，自定義 Filter 使用 Kernal 語言進行開發（一種類似 GLSL 的腳本語言）。目前一共有兩種開發 CIKernel 程序的模式:

第一種是傳統的基於 CIKernal 開發語言進行編寫，然後編譯成 Metal 或者 GLSL 的方式，第二種是直接使用 Metal Shading 語言進行開發，然後在 build 期間就生成二進制的庫，執行階段 load 之後直接轉換為 GPU 的指令。

目前因為蘋果主推 MPS(Metal Performance Shader), 所以方式一已經被標記為 deprecated

按組讀寫

使用 Metal 來開發 CIKernel 的優勢：

支持半精度浮點數；
支持按組讀寫(Group read & Group write)；

半精度浮點是純運算性質方面的優化，在 A11芯片上運算更快，而且因為用到的寄存器小所以也有較大的優化空間。

接下來重點介紹一個按組讀寫。

假設我們對左圖紅框像素做一個3x3的卷積運算，結果為存入右邊的綠色框。顯而易見，對於每個新的像素，都需要讀取輸入圖像9次像素值。

但如果是按組讀寫，如下圖所示。我們一次性讀取16個像素來計算並寫入右邊的四個像素，那我們整個過程中寫了4次，讀取了16次。每個新像素平均需讀取的數量為4，比上述的單像素需要9次顯著降低。

按組讀寫的原理是很簡單的，接下來介紹一下如果我們有一個之前使用 CIKernal Language 開發的 kernal，如果修改使其能夠使用按組讀寫這樣高速的優化。

假設我們的 kernal 如下圖所示：

第一步，轉換為 metal：

第二步，改造為按組讀寫的模式。核心就是使用了 s.gatherX 來實現。

在使用了按組讀寫和半浮點經典的優化後，基本都可以得到 2倍的性能提升。

2. 在 Core Image 體系上快速搭建濾鏡原型

一般來講，一個濾鏡典型的研發流程是首先在電腦上進行快速原型的測試，之後再移植到生產環境，電腦上有大量的工具（OpenCV，SciPy，Numpy，Tensorflow，等等）來進行原型，而生產環境的技術棧卻是 Core Image， vImage，Metal等完全不同的技術架構棧，這往往會導致一個問題:在電腦上原型測得好好的，結果到手機上效果卻撲街了。

蘋果為了解決這個問題，發佈了一個神器 —— PyCoreImage。

初次看到這個名詞是不是感到非常穿越？但其實很明顯，就是可以在 Python 中調用 Core Image 的接口 。

我們在 prototype 的時候使用 Python + PyCoreImage 這樣的方式，那就最大程度的模擬了真實的運行環境，基本上移植到手機上效果也不會打折。而且最關鍵的是， 只要學一個框架就好了啊，多的學不完啊！！！！

在使用 PyCoreImage 時，最關鍵是要了解 PyObjc 的用法，PyObjc 在 OS X 10.5 發佈，實現了在 Python 可以調用 Objective-C 的代碼，其中最主要的轉換規則就是冒號變下劃線，具體可以參考圖中的例子。

說回 PyCoreImage，其中的原理其實大概也可以想到，如下圖所示，PyCoreImage 通過 PyObjC 和 macOS 的 Core Image 進行交互，並將結果輸出回 NumPy。

下圖中的代碼首先導入了一個圖片，然後對其應用高斯模糊的 Filter，然後將結果輸出到變量 bar 中。

剩下的更多關於 PyCoreImage 的用法可以參考 Session 的 ppt，這裡不再贅述。

3. 在 Core Image 體系上應用機器學習

圖像處理和計算機發展至今，已經大量通過使用機器學習和深度學習來提升算法的效果。Core Image 也對機器學習提供了非常有好的支持。

CoreML Filter

Core Image 現在可以直接將圖片 apply 到一個 CoreML 的模型裡，相對於給 Core Image 的 Filter 鏈接上了深度學習的能力。

iOS12 中的 Core Image 提供了 CICoreMLModelFilter 類來將 CoreML 的 model 封裝成 Core Image 能夠識別的 Filter 格式。

下圖是一個 ML 領域的經典應用的例子（風格遷移）

不過現在在網上還完全搜不到 CICoreMLModelFilter ，(大霧

數據填補

對於機器學習而言，訓練集的完整性、覆蓋度能夠很大程度上決定最後模型的精確程度。但是現實情況是，我們往往沒有那麼多訓練集，在這樣的情況下，學術界一般都採用對現有訓練集的圖片進行相應的變化來起到擴充數據集的作用。這類技術統稱 數據填補(Data Augmentation

Core Image 對於這類任務天生支持的很好，支持包括以下幾種類型的變化：

圖像外觀；
圖像噪聲；
幾何變換；

以下是幾種使用 Core Image 的不同 Filter 來將一張圖變多多張訓練圖片的例子：

小結

這個 Session 帶來的內容總體來說還是激動人心的，雖然有的同學可能覺得比較小，沒有那種顛覆式的創新，但對於從事圖像領域工作的同學而言，毫無疑問這幾個工作都給人一種 mind opener 的感覺，切實的反應了蘋果對於多媒體、用戶體驗這兩個領域非常超前的思考。

分享到:

閱讀更多 繁華落盡and曲終人散 的文章

關鍵字: Python 更強編程語言

基於 JavaScript 進行符號執行測試

基於 ThinkPHP 的內容管理系統

基於 goframe 實現的日誌中心平臺

基於 MVC + Bootstrap的微信門戶應用開發框架源碼

基於 Elasticsearch 搜索平臺

基於 Python 開發的在線文檔系統

02.24 谷歌T5 基於 Transformer的文本到文本轉換框架

基於 MongoDB 解決微服務設計中的原子寫入問題

02.13 基於 Flink 的實時特徵平臺在攜程的應用

基於 Flink 的實時特徵平臺在攜程的應用

基於 GNN 的圖表示學習

基於 element-ui 的數據驅動表單組件

基於 C# 的開源算法交易引擎

01.10 基於 Python 協程的併發編程實踐！你學會了嗎？

開箱即用~基於.NET Core的統一應用邏輯分層框架設計

基於 SpringBoot、jwt和JwtPermission實現的前後端分離開發框架

基於 CNN 的文本分類算法

基於 Vue 的兩層吸頂踩坑總結

基於 CNN 的驗證碼破解實戰

基於 TensorFlow.js 的遷移學習圖像分類器

基於 Kubernetes 的微服務圖形化管理界面——Kuboard

基於 xmake，助力打造跨平臺 C

基於@ControllerAdvice註解的SpringBoot項目全局異常處理

基於 SpringBoot 的一款純淨開發腳手架，方便快速二次開發的框架

【開源推薦】基於 SpringBoot 從0到1構建分佈式秒殺系統

基於 SpringBoot + Vue 的一個前後端分離商城項目

基於 RocksDB 的索引數據存儲

基於 Prophet 的時間序列預測

基於 HTTP 協議的幾種實時數據獲取技術

04.01 基於 Linux 內核新特性的網關設計實踐

基於 Python 的網易民謠歌詞數據分析

基於 Python 的圖片爬蟲程序設計(續)

基於 Python 的圖片爬蟲程序設計

基於 Kafka 實現分佈式事件驅動

基於 Quartz 開發企業級任務調度應用

基於 SpringCloud 的微服務治理架構落地實踐

01.08 微服務：基於 Docker 的微服務架構之分佈式企業級實踐參考

基於 Spring Cloud 的微服務落地

程序員寶典：基於 JHipster 的代碼生成

土木工程三維模型愛好者必看：基於 C 的三維模型可視化技術

Ocelot-基於.NET Core的開源網關實現

07.06 基於 dubbo 的分佈式架構

基於 Maven 的多模塊 Java（Spring）項目構建

基於 Elasticsearch 構建搜索引擎

基於.NET CORE微服務框架 -淺析如何使用surging

04.02 基於 Docker 的微服務架構實踐

全網最詳細微信跳一跳腳本開發！基於 python開發！ios安卓通吃！

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"