Board logo

标题: [求助] 怎么解决htm文件转换为txt文件产生乱码的问题? [打印本页]

作者: gotsis    时间: 2010-1-21 00:00     标题: 怎么解决htm文件转换为txt文件产生乱码的问题?

我想把很多英文版的htm文件转换成txt。
但几乎把所有的htm txt转换工具都试过了,但结果都有乱码。
后来我发现是编码的问题,用浏览器打开看到的文字正常,但是如果直接用记事本打开htm文件看源代码就发现有乱码了。
求教高手怎么解决这个问题?
作者: huangwenen    时间: 2010-1-21 00:11

用记事本打开是没有格式可言的,直接复制在word可以不?
作者: gotsis    时间: 2010-1-21 00:18

在word里倒是可以,但我要转换的文件有好几百个,不可能一个一个的打开另存啊。
试了试word的宏,但是每次打开一个htm文件都要询问是否加载css,所以貌似用宏也无法批量操作了。
作者: ruiyang0000000    时间: 2010-1-26 01:31

好像没有什么比较好的转换软件,都会出现错误,最好是直接下载TXT
作者: linsion    时间: 2010-1-26 02:52

看下html 的源码,看他是用什么编码的,保存的时候选相应的保存编码试下。
一般网页都有如:
<meta http-equiv="Content-Type" content="text/html; charset=gbk" />
gbk 就是所用的编码。




欢迎光临 SiS001! Board - [第一会所 关闭注册] (http://154.84.6.60/bbs/) Powered by Discuz! 7.2