热度 8
选定目录后单击“确定”按钮。
然后在TXTFORMAT窗口上方的工具栏里面,选择文件分割/章节处理
单击“重新获取章节名”按钮,这个过程根据文本的大小会花费不同的时间,请耐心等候……
然后再单击“导出章节标题列表”按钮
TXTFORMAT会给出相应提示,单击“确定”按钮即可。当然也可以直接用“文件分割/章节整理”的小窗口来进行比对,呵呵。
TXTFORMAT会自动打开生成的目录文件(默认路径是放在TXTFORMAT所在的目录,文件名默认为:ChapterList.txt)
凡是出现了问号的章节(例如上图中第二章、第三章、第十六章等)都是有问题的,上图第二栏是章节文中的字数,第三栏是章节的正序号!
根据这个章节文件,可以比较方便的定位有问题的章节!直接打开原文,定位到有问题的章节,进行相应处理即可。
对比章节一般去原站进行对比即可。
这里面有几个地方需要注意一下:
1、有的章节名不规范,例如这样:第二十二 XXX,缺少“章”字,这个直接在原文中补上“章”字即可;
2、缺章(经与原站对比后),先记录下来,然后去百度、贴吧或是其他站点下载该章;
3、重复章节,这里分为两种情况:原站原本就是重复章节名(内容不同),可以注明一下;再一种就是文本本身重复了(内容相同),直接删掉即可;
4、章节名没有第章关键字,例如这样:212. 213. 214. ,这时候需要先处理一下,用EMEDITOR打开原文,按住CTRL+F键,出现如下窗口
单击“替换”按钮,如下图所示:
在查找的输入框中输入:[0-9]{1,4}[.]{1} 在替换为输入框中输入:第\0章 (注意章字后面带有一个空格!),然后勾选“使用正则表达式”,单击“替换全部”按钮。
注意:这样替换会导致出现 第212章章 XXX的情况,再来将“章章 ”替换为“章 ”就行了。
这里有个问题要注意一下,就是这种替换可能会导致正文中的数字也被替换了,所以在替换之前先检查一下。在上面的查找窗口中,点击“全部提取”按钮(注意需要先填写好正则表达式,参见替换窗口),EMEDITOR会将所有满足条件的文本全部提取出来,这样就便于检查了,呵呵。
此文篇幅较长,关于通用处理部分就放在下一次再来说吧,呵呵。
|Archiver|手机版|小黑屋| ( Q群816270601 )
GMT+8, 2024-5-4 21:39 , Processed in 0.136393 second(s), 24 queries .
Powered by Discuz! X3.2
© 2001-2013 Comsenz Inc.