无门槛 | MOOC视频字幕提取【保姆级指南】在此,快别抄笔记啦!

懒人技术贴(*゜ー゜*)

无门槛 | MOOC视频字幕提取【保姆级指南】在此,快别抄笔记啦!

鉴于很多读者没有代码功底,而且为了一门课的笔记,而去学习一门新代码语言从时间效率上讲很不划算。因此将其改造为简明易懂好操作、无门槛字幕提取+文档删除多余字符+省纸排版的方法。

* 无需使用python或任何代码语言 !

【由于将字幕提取完毕,打印出来之前会应用word消除数字字符,因此比较适用于文科笔记】~

话不多说,马上开始ψ(`∇´)ψ


一、中国大学MOOC网课字幕提取

1.打开你所要下载字幕的MOOC视频,例如
https://www.icourse163.org/learn/BNU-1001563013?tid=1450339461#/learn/announce


2. 于所在页面按F12键(或者WIN+F12),然后点击network。


无门槛 | MOOC视频字幕提取【保姆级指南】在此,快别抄笔记啦!


3.接着按ctrl+F会出来一个Search搜索框,按(WIN+)F5刷新该页面(也可以点击浏览器的刷新按钮)

无门槛 | MOOC视频字幕提取【保姆级指南】在此,快别抄笔记啦!

接下来右侧时间轴会刷新,等它刷新完毕


4. 在

搜索框中输入:downloadVideoSrt.htm,按回车键进行搜索。

无门槛 | MOOC视频字幕提取【保姆级指南】在此,快别抄笔记啦!

右下角是当前页面的刷新时间


5.点击搜索到的链接,右边会显示一条黄色代码。

无门槛 | MOOC视频字幕提取【保姆级指南】在此,快别抄笔记啦!

无门槛 | MOOC视频字幕提取【保姆级指南】在此,快别抄笔记啦!

这个过程可能需要你调整一下侧边宽度


复制代码中url后的地址到浏览器中,下载该视频的字幕文件,一般为txt文件。

无门槛 | MOOC视频字幕提取【保姆级指南】在此,快别抄笔记啦!

选中地址,右键【直接跳转】


6. 字幕文件默认命名videoSrt。

无门槛 | MOOC视频字幕提取【保姆级指南】在此,快别抄笔记啦!

改名后的结果如下~

无门槛 | MOOC视频字幕提取【保姆级指南】在此,快别抄笔记啦!

至此,字幕已经提取完毕,但是txt文件中还保有字幕的时间轴信息,接下来我们坚持住,最后耐心去word里面几步轻松删除~

无门槛 | MOOC视频字幕提取【保姆级指南】在此,快别抄笔记啦!


二、消除多余字符

1.打开txt文件,ctrl+A全选。

无门槛 | MOOC视频字幕提取【保姆级指南】在此,快别抄笔记啦!


2.新建WORD,准备好分类标题。

由于稍后会消除所有【数字】,因此数字标题改用汉字。

无门槛 | MOOC视频字幕提取【保姆级指南】在此,快别抄笔记啦!


3.点击【开始】右侧的【查找替换】,找到如下图的【特殊格式】

选择【任意数字】,随后开始清除数字。

无门槛 | MOOC视频字幕提取【保姆级指南】在此,快别抄笔记啦!

清除成果

无门槛 | MOOC视频字幕提取【保姆级指南】在此,快别抄笔记啦!

但是还有许多不必要的标点符号,如下图左下角、右下角的黄标所示。

无门槛 | MOOC视频字幕提取【保姆级指南】在此,快别抄笔记啦!


4.在【查找内容】框格 输入“[:,->]”(还想替换哪些符号,一并填入“[ ]”)

随后,勾选【高级搜索】下的【使用通配符】,点击【全部替换】即可。

无门槛 | MOOC视频字幕提取【保姆级指南】在此,快别抄笔记啦!


5.将页面布局的【分栏】选为【三栏】(节约打印的纸张ˋ( ° ▽、° ) )

剩下的工作就是清除之前被时间轴信息占用的空行位置。

如果是WPS用户,选择【文字助手】中的【消除空行】,完成~


* 用word消除多余字符相较于python的唯一BUG是:年份等等数字也没了,只能听课的时候手动添加。


无门槛 | MOOC视频字幕提取【保姆级指南】在此,快别抄笔记啦!


好惹,接下来大家自行打印、装订成册就OK辣ˋ( ° ▽、° )

灵感来源:上慕课抄笔记巨费时间(手要断了),于是突发奇想+生活所迫ˋ( ° ▽、° ) ᚼȍ搞出来这篇帖子。

看在转行中文专业的前程序媛的份上大家给个赞叭!(算我ball ball你们(●'◡'●))


无门槛 | MOOC视频字幕提取【保姆级指南】在此,快别抄笔记啦!


分享到:


相關文章: