首页 > 编程知识 正文

读取mdx词典,python函数传入字典参数

时间:2023-05-06 16:31:14 阅读:170153 作者:4561

只需记录个人资料,便可自行使用python从mdx词典文件中批量提取单词和所需部分词义的代码。 如果您需要自己打包以创建或编辑mdx文件,请转到pdawiki论坛。 那里有完整的词典制作区,可以知道方法。 正文mdx离线自编词典,或者anki这样的学习工具,以及它的扩展派生工具,大多是用Python编写的,实际上各种工具模块非常多。

如果想从mdx中查单词并返回词义的话,其实通过简单的模块调用就可以完成。

from readmdict import MDX, MDD # pipinstallreadmdictfrompyqueryimportpyqueryaspq # pipinstallpyquery # mdx文件filename=' TLD.mdx ' head words=[ * mdery 释义html源列表ifLen )头words )==len(items ) 3360打印) f '加载成功:共) len )头words ) )。 ELSE3360print(f )【error】加载失败(len ) headwords (),(len ) items ) )、单词和html文件query word=' walkman ' wordindinds ) html=word.decode (,html.decode ) #print ) word,html ) )从html中提取必要的部分,这里设定为thelitml,至此,配合自己调查的词典的html形式doc=pq(html ) coca2=doc(div[class='coca2'] ) ).text ).replace )n ),'') meaning=doc (' ' div [ cllasted ] )

这里不需要知道解包方法,通过直接安装readmict模块,对mdx的加载就可以得到各个单词的html文件。 关于从html中提取词义,就像爬行动物从网页中提取内容一样,知道BeautifulSoup、pyquery等就好了。 我在这里用的是pyquery。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。