懶人技術貼(*゜ー゜*)
鑑於很多讀者沒有代碼功底,而且為了一門課的筆記,而去學習一門新代碼語言從時間效率上講很不划算。因此將其改造為簡明易懂好操作、無門檻的字幕提取+文檔刪除多餘字符+省紙排版的方法。
* 無需使用python或任何代碼語言 !
【由於將字幕提取完畢,打印出來之前會應用word消除數字字符,因此比較適用於文科筆記】~
話不多說,馬上開始ψ(`∇´)ψ
一、中國大學MOOC網課字幕提取
1.打開你所要下載字幕的MOOC視頻,例如
https://www.icourse163.org/learn/BNU-1001563013?tid=1450339461#/learn/announce
2. 於所在頁面按F12鍵(或者WIN+F12),然後點擊network。
3.接著按ctrl+F會出來一個Search搜索框,按(WIN+)F5刷新該頁面(也可以點擊瀏覽器的刷新按鈕)
接下來右側時間軸會刷新,等它刷新完畢
4. 在搜索框中輸入:downloadVideoSrt.htm,按回車鍵進行搜索。
右下角是當前頁面的刷新時間
5.點擊搜索到的鏈接,右邊會顯示一條黃色代碼。
這個過程可能需要你調整一下側邊寬度
複製代碼中url後的地址到瀏覽器中,下載該視頻的字幕文件,一般為txt文件。
選中地址,右鍵【直接跳轉】
6. 字幕文件默認命名videoSrt。
改名後的結果如下~
至此,字幕已經提取完畢,但是txt文件中還保有字幕的時間軸信息,接下來我們堅持住,最後耐心去word裡面幾步輕鬆刪除~
二、消除多餘字符
1.打開txt文件,ctrl+A全選。
2.新建WORD,準備好分類標題。
由於稍後會消除所有【數字】,因此數字標題改用漢字。
3.點擊【開始】右側的【查找替換】,找到如下圖的【特殊格式】
選擇【任意數字】,隨後開始清除數字。
清除成果
但是還有許多不必要的標點符號,如下圖左下角、右下角的黃標所示。
4.在【查找內容】框格 輸入“[:,->]”(還想替換哪些符號,一併填入“[ ]”)
隨後,勾選【高級搜索】下的【使用通配符】,點擊【全部替換】即可。
5.將頁面佈局的【分欄】選為【三欄】(節約打印的紙張ˋ( ° ▽、° ) )
剩下的工作就是清除之前被時間軸信息佔用的空行位置。
如果是WPS用戶,選擇【文字助手】中的【消除空行】,完成~
* 用word消除多餘字符相較於python的
好惹,接下來大家自行打印、裝訂成冊就OK辣ˋ( ° ▽、° )
靈感來源:上慕課抄筆記巨費時間(手要斷了),於是突發奇想+生活所迫ˋ( ° ▽、° ) ᚼȍ搞出來這篇帖子。
看在轉行中文專業的前程序媛的份上大家給個贊叭!(算我ball ball你們(●'◡'●))