在配置好Arch Linux CN源后,我想安装RIME中州韵输入法,在Pacman中搜索。这时,搜索结果中好像出现了什么神奇的东西:
1 |
|
好家伙,它们是专为中州韵打造的词库,采撷自萌娘百科和维基百科。百科平台的条目本身是个宝藏语料库,添加它们可以大大提升输入体验,不再苦苦一个字一个字地去拼、去凑。尤其是萌娘百科的词库,对使用中州韵的ACG爱好者来说,更是天大的福音,从此再也不用担心打不出番句名角色名了!
制作这些词库,显然用不着一个个去翻百科。它们都使用MW2Fcitx(MediaWiki To Fcitx)这个项目来生成。MW2Fcitx能够调用API,从基于MediaWiki的百科网站中获取所有的条目标题,将它们汇编成Fcitx下输入法可用的词库。像维基百科、萌娘百科都是基于MediaWiki搭建的,MW2Fcitx自然支持它们。
接下来就讲解如何使用MW2Fcitx来充实你的词库。
安装MW2Fcitx
MW2Fcitx使用Python开发,借助pip
即可轻松安装:
1 |
|
它会安装一个脚本程序mw2fcitx
。在Windows下(含Msys2),pip
会把mw2fcitx
启动脚本安装到Python所在目录里。在Linux中则默认安装到~/.local/bin
,需要手动将该目录加入PATH
中。
编写配置文件
在当前目录下,创建一个文件config.py
,它将用于指定MW2Fcitx如何获取并生成词库。根据文件中的注释,修改相应的内容。
1 |
|
注意以下选项:
api_path
,是MediaWiki网站的API路径,通常指向站点根目录的api.php
。如萌娘百科对应https://zh.moegirl.org.cn/api.php
。
output
,是输出词库的文件名。建议以.yaml
为扩展名,因为RIME似乎会优先识别这个扩展名的文件。
安装词库文件
生成的词库通常安装在RIME的资源目录下,位于/usr/share/rime-data
。接下来我们把刚生成的词库复制到该目录下:
1 |
|
在Arch Linux中安装的fcitx5-pinyin-moegirl-rime
和fcitx5-pinyin-zhwiki-rime
这两个包,也会直接把词库安装在上述目录下。下文假设你安装了它们。
更改输入方案配置文件
词库安装好后,还需更改输入方案的配置文件,把生成的词库包含于其中。这里分别以朙月拼音和四叶草拼音(Clover Pinyin)为例。
配置文件目录:
- Fcitx4:
~/.config/fcitx/rime/
- Fcitx5:
~/.local/share/fcitx/rime/
例1:朙月拼音(简化字)
第一步,新建自定义词典文件。在配置文件目录中,新建luna_pinyin.mydict.dict.yaml
(mydict
部分可任取),内容如下:
1 |
|
注意:必须保留YAML正文前后的各3个横杠,这是词库的固定语法。
第二步,新建自定义拼音方案文件。在RIME中,用户修改拼音方案并不是直接修改源文件,而是以“打补丁”的形式进行。在配置文件目录中,新建luna_pinyin_simp.custom.yaml
,内容如下:
1 |
|
第三步,重新部署。右键点击系统托盘的RIME图标,选择“重新部署”,稍等片刻即可使用。
例2:四叶草拼音
第一步:新建/修改配置文件。在配置文件目录中,新建clover.dict.yaml
,内容如下:
1 |
|
如果已经有该文件,则直接在import_tables
列表后追加项目即可。
第二步,重新部署。右键点击系统托盘的RIME图标,选择“重新部署”,稍等片刻即可使用。
注意:维基百科等容量大的词库,重新部署的时间会比较长。耐心等待。
总结
完成部署后,词库就会充实不少。只需稍微打一下词条的全拼,还没输完,自己正渴求的词条就会跃然屏幕上,够惊艳!
不少领域的爱好者会使用MediaWiki搭建百科,萌娘百科就是一例。使用MediaWiki把它们做成词库,在自己喜爱的领域里享受极致的输入体验,暖暖的,很贴心。
参阅
- MW2Fcitx 官方Repo:https://github.com/outloudvi/mw2fcitx
- 本文作者: 爱拼安小匠
- 本文链接: https://anclark.github.io/2022/05/03/Struggle_with_Linux/MW2Fcitx/
- 版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-ND 3.0(署名-非商用-禁止演绎 3.0) 许可协议。转载请注明出处!