SFFAI 58 X CRIPAC報名通知

SFFAI 58 X CRIPAC報名通知 | 文字識別專場

由於特殊時期,SFFAI出於對大眾健康的優先考慮,以及致力於為大眾提供更高效、更便捷的參會體驗,現已將SFFAI58期論壇改為線上形式。


SFFAI 合作機構 CRIPAC 簡介

智能感知與計算研究中心(www.cripac.ia.ac.cn)為中科院自動化研究所獨立建制的科研部門,致力於研究泛在智能感知理論與技術以及與之相伴的海量感知數據的智能分析與處理。瞄準國際學科前沿,面向國家公共安全、智能產業發展等重大戰略需求,著眼於基礎理論創新與關鍵技術突破以及系統解決方案的研製,努力打造成為國際一流的研究中心,是集人才培養、技術創新、產業孵化為一體的創新平臺。中心目前主要在多模態智能計算、生物識別與安全、生物啟發的智能計算、智能感知基礎理論四個方面展開科學研究。


論壇主題

文字識別專場


論壇簡介

讓機器學會閱讀文字一直以來是人們追求的目標,閱讀的過程可以分為文本檢測與識別兩個部分,其中識別部分是將圖片中的文字轉錄成計算機可以編輯的文本格式。雖然近年來掃描文檔的識別取得了很好的性能,但由於場景中文字的多樣性、背景的複雜性等,識別自然場景中的文字依舊是一個有挑戰的任務。本期論壇我們將分享兩篇分別發表在AAAI2020和CVPR2020上的兩篇場景圖像文字識別的新工作。


論壇講者

SFFAI 58 X CRIPAC報名通知 | 文字識別專場

喬峙

喬峙,中國科學院信息工程研究所第三研究室在讀碩士生,導師為周宇副研究員。2018年本科畢業於吉林大學。主要研究方向為場景文字檢測與識別,曾在CVPR上發表一作論文。

報告題目:基於語義強化編碼器解碼器框架的場景文字識別方法

報告摘要:近年來,主流的場景文本識別方法大多基於注意力機制的編碼器解碼器框架,並取得了非常好的性能,能夠處理任意形狀的文本。但是對於一些如模糊,遮擋,有不完整字符的低質量文本圖片,現有的方法依舊很難處理。我們認為這是由於基於注意力機制的方法會更加集中於局部特徵,而忽略了圖片中整個文本的全局信息,從而缺乏一個有效的引導。本次報告將介紹我們小組發表於CVPR2020上的工作,基於語義強化編碼器解碼器框架(Semantics Enhanced Encoder-Decoder Framework, SEED)的場景文字識別方法。在現有注意力機制的框架下,SEED通過預測一個全局的語義信息來指導解碼過程,同時對全局語義信息進行有效的監督。我們將提出的框架應用到現有識別方法ASTER中,在目前公開的數據集上性能都有明顯的提升。

Spotlight:

  1. 對目前將語義信息與文字方面任務結合的工作進行簡述;
  2. 介紹語義強化的編碼器解碼器框架;
  3. 介紹提出的框架在現有識別方法ASTER上的應用。
SFFAI 58 X CRIPAC報名通知 | 文字識別專場

何明航

何明航,華中科技大學電信學院在讀碩士,VLR實驗室成員,導師為白翔教授。主要研究興趣包括文字檢測和識別。曾在TPAMI,AAAI上發表論文。

報告題目:基於分割的文字識別方法

報告摘要:近年來由於深度學習的興起和海量數據的驅動,場景文字識別領域取得了快速的發展,現在比較流行的文字識別的方法採用的是RNN attention的結構,取得顯著的識別結果的同時這種結構也有一些缺點,比如在長文本,低質量的文本上容易出現attention的累計誤差(attention drift),引起識別錯誤。最近出現了一種使用分割網絡來做文字識別的方法,採用的模型很小而且易於訓練,但是後處理過程中涉及到取閾值和找連通域的操作,在一些排列緊密,或者較模糊的文字區域容易造成漏字和多字,另外該網絡需要字符級別的監督才能正常訓練。

我們在AAAI-20的文章中提出了新的識別模型——TextScanner,同樣以分割的方法為基礎,在此之上加入了一個簡單的排序分支,保證文字中的字符以正確的順序讀取,並大大減輕了上述的分割為基礎的識別方法中漏字,多字的問題。除此之外,我們引入了一種新的機制——mutual supervision,使得TextScanner在合成數據上預訓練之後,可以用弱監督的方式在沒有字符級別監督的真實數據上繼續訓練。

Spotlight:

  1. 排序分支;
  2. 弱監督;
  3. 在各個數據集上都取得了state-of-the-art的結果;
  4. 對長文本對長文本,中文的識別有優勢。


召集人

SFFAI 58 X CRIPAC報名通知 | 文字識別專場

劉暢

劉暢 ,中國科學院大學,模式識別與智能系統開發實驗室在讀博士生,導師為葉齊祥教授,研究方向為深度特徵表示學習,曾在CVPR、ECCV、AAAI等發表一作論文。


論文推薦

“ 本期推薦的文章主要關注於文字識別,你可以認真閱讀講者推薦的論文,來與講者及同行線上交流哦。”

回覆"SFFAI58論文"獲取本主題精選論文

SFFAI 58 X CRIPAC報名通知 | 文字識別專場

推薦理由:在解決任意形狀文本識別問題中,ASTER是基於矯正方法中最經典的方法之一,在多個數據集上都取得了非常優秀的性能。

—— 喬峙

SFFAI 58 X CRIPAC報名通知 | 文字識別專場

推薦理由:基於二維注意力機制的識別方法也是處理任意形狀文本有效的思路,SAR提出了一個簡單有效的二維注意力機制的框架,取得了非常不錯的性能。

—— 喬峙

SFFAI 58 X CRIPAC報名通知 | 文字識別專場

推薦理由:一系列將語義信息與文本任務結合起來的文章,思路都比較新穎有趣,值得閱讀。

—— 喬峙

SFFAI 58 X CRIPAC報名通知 | 文字識別專場

推薦理由:ASTER是文字識別領域很經典的論文,用STN+attention decoder的結構來做文字識別,現在很多文字識別的論文都以此為基礎進行改進。

—— 何明航

SFFAI 58 X CRIPAC報名通知 | 文字識別專場

推薦理由:第一篇用分割的方法來做文字識別的文章,較為詳細的分析和探究了用分割方法做文字識別與attention decoder的方法相比的優缺點。

—— 何明航

SFFAI 58 X CRIPAC報名通知 | 文字識別專場

推薦理由:將弱監督的方法引入到文字檢測的任務中,具有很強的啟發性。

—— 何明航


報名方式

會議時間

2020年3月29日(週日)

19:00 -- 20:30

報名方式

對話框回覆“SFFAI58”,獲取入群二維碼。


SFFAI的介紹

Student Forums on Frontiers of Artificial Intelligence,簡稱SFFAI。

現代科學技術高度社會化,在科學理論與技術方法上更加趨向綜合與統一,為了滿足人工智能不同領域研究者相互交流、彼此啟發的需求,我們發起了SFFAI這個公益活動。SFFAI每週舉行邀請一線科研人員分享、討論人工智能各個領域的前沿思想和最新成果,使專注於各個細分領域的研究者開拓視野、觸類旁通。

SFFAI目前主要關注深度學習、計算機視覺、自然語言處理、數據挖掘等各個人工智能垂直領域及交叉領域的前沿進展,讓觀眾瞭解到講者在研究中獲得的經驗,也為講者塑造個人影響力。SFFAI還在構建人工智能領域的知識森林—AI Knowledge Forest,通過彙總各位參與者貢獻的領域知識,沉澱線下分享的前沿精華,使AI Knowledge Tree枝繁葉茂,為人工智能社區做出貢獻。

SFFAI自2018年9月16日舉辦第一期線下交流,每週一期,風雨無阻,截至目前已舉辦57期交流活動,共有100+位講者分享了他們的真知灼見,來自100多家單位的同學參與了現場交流,通過線上推文、網絡直播等形式,50000+人次參與了SFFAI的活動。

SFFAI自發起以來,迅速成長壯大,已經成為人工智能學生交流的第一品牌,有一群志同道合的研究生Core-Member夥伴,有一批樂於分享的SPEAKER夥伴,還有許多認可活動價值、多次報名參加現場交流的觀眾,大家通過參與SFFAI,收穫了寶貴的友誼和知識。

SFFAI 58 X CRIPAC報名通知 | 文字識別專場


分享到:


相關文章: