本文介绍: 听说没有好用的电脑端背单词软件?只好麻烦一下,花了一小时,拿python手搓了一个考研背单词软件。代码已经开源在GitHub上,欢迎大家STAR!

听说没有好用的电脑端背单词软件?只好麻烦一下,花了一小时,拿python手搓了一个考研背单词软件。
在这里插入图片描述
代码已经开源在我的github上,欢迎大家STAR!
其中,数据是存放在sqlite中,形近词跳转是根据jaro winkler距离得到最近单词的,近义词跳转是使用huggingface上的bert-base-uncased模型得到的词嵌入向量,然后计算cosine相似距离得到的。这部分代码没有开源,大家可以自行实现,开源项目中包含了6646个考研必备单词及索引,可以正常使用检索功能。
数据库的建表语句如下,下载之后可以自己导出数据,获得完整单词库。

c.execute('''DROP TABLE IF exists process;''')
c.execute("CREATE TABLE process(id INTEGER);")
c.execute('''DROP TABLE IF exists words;''')
c.execute('''CREATE TABLE IF NOT EXISTS words(id INTEGER PRIMARY KEY AUTOINCREMENT, word TEXT, en TEXT, us TEXT, meaning TEXT, count INTEGER)''')

以后有空再来补充一些具体做法!

原文地址:https://blog.csdn.net/weixin_43997331/article/details/135376336

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。

如若转载,请注明出处:http://www.7code.cn/show_51770.html

如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱:suwngjj01@126.com进行投诉反馈,一经查实,立即删除!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注