Python如何提取chm数据
彳亍261 人气:0Python提取chm数据
需求场景
chm格式文档中的内容,提取保存为html
- 方法一 使用在线转换工具或者软件
- 方法二 脚本编译
step 1:.bat脚本反编译
使用该脚本, 可以将chm文件反编译,类似解压,获取文件。有些文档可以直接转换为txt,有些会转化为html. 这个跟生成chm文件有关系。
1 新建txt文档, 参照示例写入命令。保存后文件另存为.bat格式
hh -decompile 转换结果输出路径 待转换文件(相对/绝对路径) # 示例 hh -decompile D:\Desktop\ 123.chm
2 右键 管理员身份运行该文件即可,结果输出到命令指定的目录
step 2: html转txt
【html】Python提取html中文本到txt
查用python自带的.chm官方文档
1.去python的官方网站去下载对应版本的python,在这里下载的python会自带一份官方文档(根据操作系统选择的不同,会有不同的格式),下载windows版本的会有一个(*.chm)格式的说明文档
下载好后进入下载目录,找到Doc目录,进入
我的是windows系统,可以看到有个5-6兆的(*.chm)说明文档
windows下可以直接双击打开。
打开后的样子,可以看到很多目录,充满了知识,等待着去发掘。
如果我对python自带的某个库的使用十分不解,比如copy,
我应该这样查
想找python基本的数据类型以及使用来学习
可以这样来找
python自带的(内建的)函数有很多,了解一下
python自带了的各种异常,快来捕获吧
python语言是一种解释型语言,很大程度上解决了跨平台开发的难度,关于python的各种接口(interface)调用,以及对操作系统的支持,都可以查到。
关于英语的问题,大可不必担心,有道云翻译提供截屏翻译,鼠标取词翻译,是十分方便的,快去学习吧!
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持。
加载全部内容