SFFAI 58 X CRIPAC报名通知

SFFAI 58 X CRIPAC报名通知 | 文字识别专场

由于特殊时期,SFFAI出于对大众健康的优先考虑,以及致力于为大众提供更高效、更便捷的参会体验,现已将SFFAI58期论坛改为线上形式。


SFFAI 合作机构 CRIPAC 简介

智能感知与计算研究中心(www.cripac.ia.ac.cn)为中科院自动化研究所独立建制的科研部门,致力于研究泛在智能感知理论与技术以及与之相伴的海量感知数据的智能分析与处理。瞄准国际学科前沿,面向国家公共安全、智能产业发展等重大战略需求,着眼于基础理论创新与关键技术突破以及系统解决方案的研制,努力打造成为国际一流的研究中心,是集人才培养、技术创新、产业孵化为一体的创新平台。中心目前主要在多模态智能计算、生物识别与安全、生物启发的智能计算、智能感知基础理论四个方面展开科学研究。


论坛主题

文字识别专场


论坛简介

让机器学会阅读文字一直以来是人们追求的目标,阅读的过程可以分为文本检测与识别两个部分,其中识别部分是将图片中的文字转录成计算机可以编辑的文本格式。虽然近年来扫描文档的识别取得了很好的性能,但由于场景中文字的多样性、背景的复杂性等,识别自然场景中的文字依旧是一个有挑战的任务。本期论坛我们将分享两篇分别发表在AAAI2020和CVPR2020上的两篇场景图像文字识别的新工作。


论坛讲者

SFFAI 58 X CRIPAC报名通知 | 文字识别专场

乔峙

乔峙,中国科学院信息工程研究所第三研究室在读硕士生,导师为周宇副研究员。2018年本科毕业于吉林大学。主要研究方向为场景文字检测与识别,曾在CVPR上发表一作论文。

报告题目:基于语义强化编码器解码器框架的场景文字识别方法

报告摘要:近年来,主流的场景文本识别方法大多基于注意力机制的编码器解码器框架,并取得了非常好的性能,能够处理任意形状的文本。但是对于一些如模糊,遮挡,有不完整字符的低质量文本图片,现有的方法依旧很难处理。我们认为这是由于基于注意力机制的方法会更加集中于局部特征,而忽略了图片中整个文本的全局信息,从而缺乏一个有效的引导。本次报告将介绍我们小组发表于CVPR2020上的工作,基于语义强化编码器解码器框架(Semantics Enhanced Encoder-Decoder Framework, SEED)的场景文字识别方法。在现有注意力机制的框架下,SEED通过预测一个全局的语义信息来指导解码过程,同时对全局语义信息进行有效的监督。我们将提出的框架应用到现有识别方法ASTER中,在目前公开的数据集上性能都有明显的提升。

Spotlight:

  1. 对目前将语义信息与文字方面任务结合的工作进行简述;
  2. 介绍语义强化的编码器解码器框架;
  3. 介绍提出的框架在现有识别方法ASTER上的应用。
SFFAI 58 X CRIPAC报名通知 | 文字识别专场

何明航

何明航,华中科技大学电信学院在读硕士,VLR实验室成员,导师为白翔教授。主要研究兴趣包括文字检测和识别。曾在TPAMI,AAAI上发表论文。

报告题目:基于分割的文字识别方法

报告摘要:近年来由于深度学习的兴起和海量数据的驱动,场景文字识别领域取得了快速的发展,现在比较流行的文字识别的方法采用的是RNN attention的结构,取得显著的识别结果的同时这种结构也有一些缺点,比如在长文本,低质量的文本上容易出现attention的累计误差(attention drift),引起识别错误。最近出现了一种使用分割网络来做文字识别的方法,采用的模型很小而且易于训练,但是后处理过程中涉及到取阈值和找连通域的操作,在一些排列紧密,或者较模糊的文字区域容易造成漏字和多字,另外该网络需要字符级别的监督才能正常训练。

我们在AAAI-20的文章中提出了新的识别模型——TextScanner,同样以分割的方法为基础,在此之上加入了一个简单的排序分支,保证文字中的字符以正确的顺序读取,并大大减轻了上述的分割为基础的识别方法中漏字,多字的问题。除此之外,我们引入了一种新的机制——mutual supervision,使得TextScanner在合成数据上预训练之后,可以用弱监督的方式在没有字符级别监督的真实数据上继续训练。

Spotlight:

  1. 排序分支;
  2. 弱监督;
  3. 在各个数据集上都取得了state-of-the-art的结果;
  4. 对长文本对长文本,中文的识别有优势。


召集人

SFFAI 58 X CRIPAC报名通知 | 文字识别专场

刘畅

刘畅 ,中国科学院大学,模式识别与智能系统开发实验室在读博士生,导师为叶齐祥教授,研究方向为深度特征表示学习,曾在CVPR、ECCV、AAAI等发表一作论文。


论文推荐

“ 本期推荐的文章主要关注于文字识别,你可以认真阅读讲者推荐的论文,来与讲者及同行线上交流哦。”

回复"SFFAI58论文"获取本主题精选论文

SFFAI 58 X CRIPAC报名通知 | 文字识别专场

推荐理由:在解决任意形状文本识别问题中,ASTER是基于矫正方法中最经典的方法之一,在多个数据集上都取得了非常优秀的性能。

—— 乔峙

SFFAI 58 X CRIPAC报名通知 | 文字识别专场

推荐理由:基于二维注意力机制的识别方法也是处理任意形状文本有效的思路,SAR提出了一个简单有效的二维注意力机制的框架,取得了非常不错的性能。

—— 乔峙

SFFAI 58 X CRIPAC报名通知 | 文字识别专场

推荐理由:一系列将语义信息与文本任务结合起来的文章,思路都比较新颖有趣,值得阅读。

—— 乔峙

SFFAI 58 X CRIPAC报名通知 | 文字识别专场

推荐理由:ASTER是文字识别领域很经典的论文,用STN+attention decoder的结构来做文字识别,现在很多文字识别的论文都以此为基础进行改进。

—— 何明航

SFFAI 58 X CRIPAC报名通知 | 文字识别专场

推荐理由:第一篇用分割的方法来做文字识别的文章,较为详细的分析和探究了用分割方法做文字识别与attention decoder的方法相比的优缺点。

—— 何明航

SFFAI 58 X CRIPAC报名通知 | 文字识别专场

推荐理由:将弱监督的方法引入到文字检测的任务中,具有很强的启发性。

—— 何明航


报名方式

会议时间

2020年3月29日(周日)

19:00 -- 20:30

报名方式

对话框回复“SFFAI58”,获取入群二维码。


SFFAI的介绍

Student Forums on Frontiers of Artificial Intelligence,简称SFFAI。

现代科学技术高度社会化,在科学理论与技术方法上更加趋向综合与统一,为了满足人工智能不同领域研究者相互交流、彼此启发的需求,我们发起了SFFAI这个公益活动。SFFAI每周举行邀请一线科研人员分享、讨论人工智能各个领域的前沿思想和最新成果,使专注于各个细分领域的研究者开拓视野、触类旁通。

SFFAI目前主要关注深度学习、计算机视觉、自然语言处理、数据挖掘等各个人工智能垂直领域及交叉领域的前沿进展,让观众了解到讲者在研究中获得的经验,也为讲者塑造个人影响力。SFFAI还在构建人工智能领域的知识森林—AI Knowledge Forest,通过汇总各位参与者贡献的领域知识,沉淀线下分享的前沿精华,使AI Knowledge Tree枝繁叶茂,为人工智能社区做出贡献。

SFFAI自2018年9月16日举办第一期线下交流,每周一期,风雨无阻,截至目前已举办57期交流活动,共有100+位讲者分享了他们的真知灼见,来自100多家单位的同学参与了现场交流,通过线上推文、网络直播等形式,50000+人次参与了SFFAI的活动。

SFFAI自发起以来,迅速成长壮大,已经成为人工智能学生交流的第一品牌,有一群志同道合的研究生Core-Member伙伴,有一批乐于分享的SPEAKER伙伴,还有许多认可活动价值、多次报名参加现场交流的观众,大家通过参与SFFAI,收获了宝贵的友谊和知识。

SFFAI 58 X CRIPAC报名通知 | 文字识别专场


分享到:


相關文章: