他來了,他來了,文字、表格、公式圖片識別神器V0.1測試版

<code>

他來了,他來了,Mathpix拜拜了~~~

文字、表格、公式圖片識別神器V0.1測試版

俺不是標題黨!!!

開發背景

日常工作中經常遇到大量的圖片版文本、表格、公式需要編輯;

用手敲?也太OUT了吧,好歹咱也是個Python全棧。

2018年就開始比較各大廠的文字識別API,

BAT+H,4家的文字識別相差無幾,

表格識別,百度遙遙領先,如果給百度90分,其他3家是不及格的。

很長一段時間,沒有找到能夠替代Mathpix這個歪果產品,

從github找到tensorflow的源代碼,可惜功力不夠,無法逆向。

這不,本已放棄了自己搞公式識別,

採用InftyReader.exe這個日本軟件配合美帝的Mathpix,

勉強可以免費識別日常的工作量。

2020年4月,無意中發現百度終於開放了公式識別的API,

也不知道和我去年在百度的留言是否有關(當時鄙視了一下大廠的AI技術不接地氣)。

開發過程

2020年之前一直在用百度的文字識別API,

當然,只是在Jupyter中僅供自己使用,

也曾想過做成微信小程序,但看著微信小程序中琳琅滿目的同型產品,

還是果斷的放棄了!

如今百度公式識別的API出來了,竟讓我又燃起做一個小工具的想法,

拿起鍵盤就是個幹!

哼哧,哼哧的擼了200來行代碼,測試了十來次,大體可行:

他來了,他來了,文字、表格、公式圖片識別神器V0.1測試版

好久不用tkinter做win桌面應用,還是遇到了不少BUG,

不過,相較於後面打包遇到的BUG,前端UI都不是個事,

具體體現在:

1.conda這個奇葩雖然生猛,但是用Pyinstaller打包,一個小小的工具,竟然300M。

2.重新安裝一個版本的Python,新建虛擬環境,結果約到pip不能升級的問題。

3.再次打包,遇到Pyinstaller打包報錯Failed to execute>

4.都懶得改應用的圖標了,測試版就先這樣吧。畢竟它實現了既定的3個識別功能。


下載鏈接:

鏈接:https://pan.baidu.com/s/1N1qu3teQZunA55eCkejGdw 提取碼: saph


BUG參考文檔:

解決Python 3.6使用pip時Unable to locate finder for pip._vendor.distlib的問題​

Pyinstaller打包報錯Failed to execute>


分享到:


相關文章: