<小白上楼梯——自制输入法>系列的想法与提纲

为什么要叫小白上楼梯,是被幼儿园的儿歌给洗脑了,小白小白上楼梯,打开电视机,电视不好看,关掉电视机……

不经意间想想,其实编程,也像极了学上楼梯的小朋友,一点一点地,趔趄着往上。等到了楼上,会发现,不过如此嘛,当初的各种畏惧心理也会一扫而空,成为自己内化了的成长与经验。


<小白上楼梯——自制输入法>系列的想法与提纲

小白小白上楼梯……

缘起

很多年以前,为了能在暑假打小霸王游戏机,找老爸说是要学打字,买之,哈哈。

后来,学了五笔,因为喜欢折腾的性格,总是觉得用过的一些五笔输入法不够香,直到自己开始搜集码表,开始各种折腾。

五笔,先向王永民先生致敬,真的是很伟大的发明。大概经历了三代的变化,从85年的86五笔,算是第一代五笔,到98五笔(第二代),06五笔(第三代)。86五笔用的人最多,曾一度成为计算机课堂的重要章节。而五笔的编码方式,也经过一代代地升级之后变得更加简单直观,所以在06五笔前后,为了能更好的支持GB18030的全部字符,对86五笔的编码方案也做了一个修正,产生了WB-18030的86版五笔的修正方案,为了以前86版五笔的老用户无差异地使用,加入了容错码,比如像=wqj(亻勹日)=wqk(亻勹口),其实,老86的版本里面是没有wqk这个编码的,而WB-18030标准版本中,是正确的编码。然而,快速被拼音输入法所代替的五笔输入法,很多开发输入法的公司,将它给放弃了,就算过个好几年,象征性地更新一下,词库内容却一直没有去更新维护。

直到有一天,发现了Google的在线输入,里面有五笔,居然还有容错码,居然还有提示,真香。

费了九牛二虎之力,拿到了从a-yyyy的所有请求的返回值,经过简单地替换加工之后,挂在别的输入法里面用了起来,效果不错。下文为下载码表的大概过程,在后面的文章里,我会将提到的一些细节,小的知识点分解开来,展示出来。

<小白上楼梯——自制输入法>系列的想法与提纲

加油

用一张本地网页,完成码表的收集

其实很简单的思路,在网页中将ajax请求到的数据放入一个数组中,然后将在页面上将数组显示出来就好了,旁边准备好一个文本文档,拿到一些,保存一些。经过漫长的重复与等待。也算拿到了比较完整的“码表”了。

用带有正则表达式的文本编辑器完成码表的整理

一句话解释就是,替换掉一些无用的信息,只保留自己需要的关键条目就好了,比如`aa 式`这样子的简单码表。一个编辑器,底线要求是能够轻松,随心地完成一些文本的处理,支持正则表达式。正则表达式,在我认为也是人类很神奇的一个发明,能带来很多很多的便利。

Excel其实很强大

比如`vlookup`函数、if函数、排序、筛选几个功能,帮我解决了很多平时遇到的一些小困难。

学习Python,用代码表达自己的想法

有一个笑话讲雪糕与冰箱的故事:

<code>            # 有一天雪糕和冰箱吵架了,雪糕离开了冰箱,
# 在路上,她越来越后悔,她发现自己在慢慢融化,
# 而且流了很多水,于是她只好回去找冰箱,
# 冰箱哼了哼,打开了门,“上来,自己冻”/<code>

做为一个足够想偷懒的人类,一定会想着各种法子,让电脑、程序、机器人帮我们完成那些需要重复并且精密的工作。

使用python下载码表、找出里面有用的容错码信息、完成排序、最后输出一个完整的完整的词库,是不是听起来有点爽?

首先,得有台电脑,再安装个Python,了解python的基本语法,会使用到循环,列表的操作,函数怎样定义,以及调用函数传参的各种方式,导入并使用一些神奇的库,如何发送请求到一个网址,如何让一个请求被服务器当成是正常通过浏览器访问的,文件的读写,还可能会用到线程、进程

或者,电脑没有情况下,手机上面如何运行Python程序。

享受过程与成果,见证自己的成长

码表做好之后,便是享受收获的时刻了,可以直接挂在别的输入法里面使用;或者自己动手生成一个完全属于自己的个性化的输入法:使用PS做图标出来,再做出自己独特的输入法皮肤。完完全全地体验一把真香定律。

动手模仿才是真正的捷径

嗯,是一句废话。


分享到:


相關文章: