無門檻 | MOOC視頻字幕提取【保姆級指南】在此,快別抄筆記啦!

懶人技術貼(*゜ー゜*)

無門檻 | MOOC視頻字幕提取【保姆級指南】在此,快別抄筆記啦!

鑑於很多讀者沒有代碼功底,而且為了一門課的筆記,而去學習一門新代碼語言從時間效率上講很不划算。因此將其改造為簡明易懂好操作、無門檻字幕提取+文檔刪除多餘字符+省紙排版的方法。

* 無需使用python或任何代碼語言 !

【由於將字幕提取完畢,打印出來之前會應用word消除數字字符,因此比較適用於文科筆記】~

話不多說,馬上開始ψ(`∇´)ψ


一、中國大學MOOC網課字幕提取

1.打開你所要下載字幕的MOOC視頻,例如
https://www.icourse163.org/learn/BNU-1001563013?tid=1450339461#/learn/announce


2. 於所在頁面按F12鍵(或者WIN+F12),然後點擊network。


無門檻 | MOOC視頻字幕提取【保姆級指南】在此,快別抄筆記啦!


3.接著按ctrl+F會出來一個Search搜索框,按(WIN+)F5刷新該頁面(也可以點擊瀏覽器的刷新按鈕)

無門檻 | MOOC視頻字幕提取【保姆級指南】在此,快別抄筆記啦!

接下來右側時間軸會刷新,等它刷新完畢


4. 在

搜索框中輸入:downloadVideoSrt.htm,按回車鍵進行搜索。

無門檻 | MOOC視頻字幕提取【保姆級指南】在此,快別抄筆記啦!

右下角是當前頁面的刷新時間


5.點擊搜索到的鏈接,右邊會顯示一條黃色代碼。

無門檻 | MOOC視頻字幕提取【保姆級指南】在此,快別抄筆記啦!

無門檻 | MOOC視頻字幕提取【保姆級指南】在此,快別抄筆記啦!

這個過程可能需要你調整一下側邊寬度


複製代碼中url後的地址到瀏覽器中,下載該視頻的字幕文件,一般為txt文件。

無門檻 | MOOC視頻字幕提取【保姆級指南】在此,快別抄筆記啦!

選中地址,右鍵【直接跳轉】


6. 字幕文件默認命名videoSrt。

無門檻 | MOOC視頻字幕提取【保姆級指南】在此,快別抄筆記啦!

改名後的結果如下~

無門檻 | MOOC視頻字幕提取【保姆級指南】在此,快別抄筆記啦!

至此,字幕已經提取完畢,但是txt文件中還保有字幕的時間軸信息,接下來我們堅持住,最後耐心去word裡面幾步輕鬆刪除~

無門檻 | MOOC視頻字幕提取【保姆級指南】在此,快別抄筆記啦!


二、消除多餘字符

1.打開txt文件,ctrl+A全選。

無門檻 | MOOC視頻字幕提取【保姆級指南】在此,快別抄筆記啦!


2.新建WORD,準備好分類標題。

由於稍後會消除所有【數字】,因此數字標題改用漢字。

無門檻 | MOOC視頻字幕提取【保姆級指南】在此,快別抄筆記啦!


3.點擊【開始】右側的【查找替換】,找到如下圖的【特殊格式】

選擇【任意數字】,隨後開始清除數字。

無門檻 | MOOC視頻字幕提取【保姆級指南】在此,快別抄筆記啦!

清除成果

無門檻 | MOOC視頻字幕提取【保姆級指南】在此,快別抄筆記啦!

但是還有許多不必要的標點符號,如下圖左下角、右下角的黃標所示。

無門檻 | MOOC視頻字幕提取【保姆級指南】在此,快別抄筆記啦!


4.在【查找內容】框格 輸入“[:,->]”(還想替換哪些符號,一併填入“[ ]”)

隨後,勾選【高級搜索】下的【使用通配符】,點擊【全部替換】即可。

無門檻 | MOOC視頻字幕提取【保姆級指南】在此,快別抄筆記啦!


5.將頁面佈局的【分欄】選為【三欄】(節約打印的紙張ˋ( ° ▽、° ) )

剩下的工作就是清除之前被時間軸信息佔用的空行位置。

如果是WPS用戶,選擇【文字助手】中的【消除空行】,完成~


* 用word消除多餘字符相較於python的唯一BUG是:年份等等數字也沒了,只能聽課的時候手動添加。


無門檻 | MOOC視頻字幕提取【保姆級指南】在此,快別抄筆記啦!


好惹,接下來大家自行打印、裝訂成冊就OK辣ˋ( ° ▽、° )

靈感來源:上慕課抄筆記巨費時間(手要斷了),於是突發奇想+生活所迫ˋ( ° ▽、° ) ᚼȍ搞出來這篇帖子。

看在轉行中文專業的前程序媛的份上大家給個贊叭!(算我ball ball你們(●'◡'●))


無門檻 | MOOC視頻字幕提取【保姆級指南】在此,快別抄筆記啦!


分享到:


相關文章: