<code>
他來了,他來了,Mathpix拜拜了~~~
文字、表格、公式圖片識別神器V0.1測試版
俺不是標題黨!!!
開發背景
日常工作中經常遇到大量的圖片版文本、表格、公式需要編輯;
用手敲?也太OUT了吧,好歹咱也是個Python全棧。
2018年就開始比較各大廠的文字識別API,
BAT+H,4家的文字識別相差無幾,
表格識別,百度遙遙領先,如果給百度90分,其他3家是不及格的。
很長一段時間,沒有找到能夠替代Mathpix這個歪果產品,
從github找到tensorflow的源代碼,可惜功力不夠,無法逆向。
這不,本已放棄了自己搞公式識別,
採用InftyReader.exe這個日本軟件配合美帝的Mathpix,
勉強可以免費識別日常的工作量。
2020年4月,無意中發現百度終於開放了公式識別的API,
也不知道和我去年在百度的留言是否有關(當時鄙視了一下大廠的AI技術不接地氣)。
開發過程
2020年之前一直在用百度的文字識別API,
當然,只是在Jupyter中僅供自己使用,
也曾想過做成微信小程序,但看著微信小程序中琳琅滿目的同型產品,
還是果斷的放棄了!
如今百度公式識別的API出來了,竟讓我又燃起做一個小工具的想法,
拿起鍵盤就是個幹!
哼哧,哼哧的擼了200來行代碼,測試了十來次,大體可行:
好久不用tkinter做win桌面應用,還是遇到了不少BUG,
不過,相較於後面打包遇到的BUG,前端UI都不是個事,
具體體現在:
1.conda這個奇葩雖然生猛,但是用Pyinstaller打包,一個小小的工具,竟然300M。
2.重新安裝一個版本的Python,新建虛擬環境,結果約到pip不能升級的問題。
3.再次打包,遇到Pyinstaller打包報錯Failed to execute>
4.都懶得改應用的圖標了,測試版就先這樣吧。畢竟它實現了既定的3個識別功能。
下載鏈接:
鏈接:https://pan.baidu.com/s/1N1qu3teQZunA55eCkejGdw 提取碼: saph
BUG參考文檔:
解決Python 3.6使用pip時Unable to locate finder for pip._vendor.distlib的問題
Pyinstaller打包報錯Failed to execute>
閱讀更多 Python數據分析實例 的文章