打印

[求助] 怎么解决htm文件转换为txt文件产生乱码的问题?

0

怎么解决htm文件转换为txt文件产生乱码的问题?

我想把很多英文版的htm文件转换成txt。
但几乎把所有的htm txt转换工具都试过了,但结果都有乱码。
后来我发现是编码的问题,用浏览器打开看到的文字正常,但是如果直接用记事本打开htm文件看源代码就发现有乱码了。
求教高手怎么解决这个问题?

TOP

0
用记事本打开是没有格式可言的,直接复制在word可以不?

TOP

0
在word里倒是可以,但我要转换的文件有好几百个,不可能一个一个的打开另存啊。
试了试word的宏,但是每次打开一个htm文件都要询问是否加载css,所以貌似用宏也无法批量操作了。

TOP

0
好像没有什么比较好的转换软件,都会出现错误,最好是直接下载TXT

TOP

0
看下html 的源码,看他是用什么编码的,保存的时候选相应的保存编码试下。
一般网页都有如:
<meta http-equiv="Content-Type" content="text/html; charset=gbk" />
gbk 就是所用的编码。

TOP

当前时区 GMT+8, 现在时间是 2025-3-14 00:02