之前介紹過一款工具,可以免費快速下載百度文庫、豆丁、道客巴巴等網站資料,
傳送門在這裡
當然這個工具也不是百分之百的有效,根據文檔的具體情況和網站程序的變動可能會有不能下載或者下載下來的文檔不如人意。
今天再介紹兩個獲取文檔的方法。
1、在線百度文庫下載 - 思維趣(http://so.jutuit.com/#21)
這是個工具聚合類的網站,其中有一項應用就是下載百度文庫。(進入網站後選擇應用19)
方法簡單,只要把百度文庫的鏈接,直接粘貼進去獲取即可。目前只能是獲取需要點券的文檔,付費的文檔暫時還不支持。
2、手動OCR識別
這個方法基本上適用所有的文庫網站,只要能夠在線預覽,都可以比較快速的獲得文檔。
基本原理就是:將文檔閱覽圖截圖生產圖片-通過OCR識別網站或者工具進行識別 - 編輯排版。
舉個例子
1)需要獲取圖片中道客巴巴某個文章裡面的一段文字,先用截圖軟件截屏,保存。
2)進入OCR識別網站,永恆君隨手網上搜了一個。
3)上傳剛剛截的圖片,選擇txt格式,開始識別。
4)複製識別的文字,稍許編輯排版即可。
這種方法和掃描文檔後識別文檔文字道理差不多,識別的效率和準確度還是可以接受的。永恆君之前也推薦過網站和微信小程序,都還不錯。
需要識別圖片文字,這三個網站可以幫到你
準確識別圖片上文字的小程序
當然,這種方法缺點也是比較明顯,需要手工將所有需要的頁面截圖下來。
但是藉助FS Capture 和按鍵精靈等工具,相信也不難。
如果你有其他更好的方法,希望能一起交流分享!
閱讀更多 永恆君的百寶箱 的文章