Aug 26

文本文档和 Word使用技巧:删除多余空行或空格

快速清除“Word文档”多余空行

在工作中,尤其是对那些搞文字工作的人来说,经常会碰到由别的地方或文件中向Word文档中导入或粘贴文本,然后用Word编辑的情况。如果粘贴过来的文本中含有多余的空行同时文档又很大,那么一个个用手工的方式删除空行的办法实在是太累人了。而且打印时又太浪费墨和打印纸,有没有较便捷的方式呢?

其实想一下空行的特点,也就是多个“段落标记”连在一起,那么我们用Word的替换功能就可实现删除文章中的空行。

打开“编辑”菜单中的“替换”对话框,把光标定位在“查找内容”输入框中,按下“高级”按钮,选择“特殊字符”中的“段落标记”两次,在输入框中会显示为“^p^p”,在“替换为”输入框中用上面的方法插入一个“段落标记”,即“^p”,然后按下“全部替换”按键,可删除单行的空行,对于多行空行,可进行重复替换,直到删除全部的空行为止。

巧妙删除“文本文档”多余空行

经常从网上粘贴或下载一篇文章,需要打印时,发现有大量多余的空行占据了许多篇幅,需要删除。这些空行要么不包含任何字符,要么包含了许多空格、制表符 (Tab)。如果文章比较长,那么手工删除空行就成为一件颇费鼠标和精力的事。难道就没有别的办法?答案是:有!
我们可以借助文本编辑器软件EditPlus、UltraEdit实现。EditPlus、UltraEdit是常见的共享软件,几乎所有软件下载网站都提供下载。由于EditPlus的操作更容易上手,但UltraEdit更为常用,所以本文先介绍在EditPlus的操作,再介绍 UltraEdit。

一、在EditPlus中删除空行

启动EditPlus,打开待处理的文件。需要注意,必须是纯文本文件,如果是Word文档,需要先粘贴到纯文本文件中。然后,步骤如下:
1.选择Search菜单的Replace命令,出现如图所示的文本替换对话框。选中Regular expression(正则表达式)复选框,表明我们要在查找、替换中使用正则表达式。然后,选中Replace all range中的Current file,表明对当前文件操作(技巧提示:可以同时打开多个文件进行操作,在这里选中“All open files”)。

^[ \t]*\n

2.单击Find what组合框右侧的按钮 ,出现下拉菜单,如下图所示。菜单命令中,本文用得着的命令依次是:Tab Character(制表符)、New Line(新行/换行符)、Character in Range(指定范围内的字符)、Beginning of Line(行开始)、0 or More Matches(0个或多个符合条件的项)。
下面的操作添加正则表达式,该表达式代表待查找的空行。(技巧提示:空行仅包括空格符、制表符、回车符,且必须以这三个符号之一作为一行的开头,并且以回车符结尾,查找空行的关键是构造代表空行的正则表达式)。
(1)选择Beginning of Line,则Find what组合框中出现字符“^”,表示待查找的字符串必须出现在文本中一行的行首,才符合条件。
(2)选择Character in Range,“^”后增加一对括号“[]”,当前插入点在括号中。括号在正则表达式中表示,文本中的字符匹配括号中任意一个字符即符合查找条件。
(3)按一下空格键,添加空格符。空格符是空行的一个组成成分。
(4)选择Tab Character,添加代表制表符的“ ”。
(5)移动光标,将当前插入点移到“]”之后,然后选择0 or More Matches,添加了星号字符“*”。星号表示,其前面的括号“[]”内的空格符或制表符,在一行中出现0个或多个。
(6)选择New Line,插入“ ”,表示回车符。
至此,正则表达式构造成功。
3.Replace with组合框保持空,表示删除查找到的内容。单击Replace按钮逐个行删除空行,或单击Replace All按钮删除全部空行(注意:EditPlus和UltraEdit均存在Replace All不能一次性完全删除空行的问题,可能是程序BUG,需要多按几次按钮)。
对于熟悉EditPlus的朋友,可以直接在Find what中输入正则表达式^[ ]* ,注意逗号前有空格符。

二、在UltraEdit中删除空行

使用UltraEdit的原理一样,但是UltraEdit没有提供菜单方式,所以需要手工输入正则表达式,而且UltraEdit的正则表达式符号与EditPlus不同。
用UltraEdit打开文件后,选择Search菜单的Replace命令。在Replace对话框中,选中Regular Expression复选框,并在Find what中输入:%[ ^t]++^p,注意^t之前有空格。该表达式字符含义与EditPlus的相对应。然后,单击Start或Replace All按钮,进行替换删除空行。
在WORD文档中可用查找/替换的方法来消除空行
查找^p^p,替换成^P。全部替换,就OK了。

WORD文本文档里的空格删除
选择“查找”,出现“查找”对话框,在“查找”内容中输入一个空格,把下方的“突出显示所在该范围找到的项目”选项选上,单击“查找全部”按钮,即可将文中的全部空格选中,然后按下键盘上的Delete键即可将全部空格删除了。

还有就是用EmEditor也可以,工具里有删除空格。还有很多专门的软件,找找就有了。

Aug 17

apache日志格式关键字

blank_page    LogFormat “%h %l %u %t \”%r\” %>s %b” common

该指令创建了一种名为“common”的日志格式,日志的格式在双引号包围的内容中指定。格式字符串中的每一个变量代表着一项特定的信息,这些信息按照格式串规定的次序写入到日志文件。
Apache文档已经给出了所有可用于格式串的变量及其含义,下面是其译文:
%…a: 远程IP地址
%…A: 本地IP地址
%…B: 已发送的字节数,不包含HTTP头
%…b: CLF格式的已发送字节数量,不包含HTTP头。例如当没有发送数据时,写入‘-’而不是0。
%…{FOOBAR}e: 环境变量FOOBAR的内容
%…f: 文件名字
%…h: 远程主机
%…H 请求的协议
%…{Foobar}i: Foobar的内容,发送给服务器的请求的标头行。
%…l: 远程登录名字(来自identd,如提供的话)
%…m 请求的方法
%…{Foobar}n: 来自另外一个模块的注解“Foobar”的内容
%…{Foobar}o: Foobar的内容,应答的标头行
%…p: 服务器响应请求时使用的端口
%…P: 响应请求的子进程ID。
%…q 查询字符串(如果存在查询字符串,则包含“?”后面的部分;否则,它是一个空字符串。)
%…r: 请求的第一行
%…s: 状态。对于进行内部重定向的请求,这是指*原来*请求 的状态。如果用%…>s,则是指后来的请求。
%…t: 以公共日志时间格式表示的时间(或称为标准英文格式)
%…{format}t: 以指定格式format表示的时间
%…T: 为响应请求而耗费的时间,以秒计
%…u: 远程用户(来自auth;如果返回状态(%s)是401则可能是伪造的)
%…U: 用户所请求的URL路径
%…v: 响应请求的服务器的ServerName
%…V: 依照UseCanonicalName设置得到的服务器名字

Aug 17

使用免费的google站内搜索

一分钟加入”搜索本站”功能
要如何在您的网页上加入此项功能呢?很简单,只要在你的网页内加入下面一小段代码就好了:
(注意:下面假设 hulucat.com  网站为例)

<form action=”http://www.google.cn/search” method=”get”>
<input name=”sitesearch” value=” hulucat.com” type=”hidden”>
<input name=”hl” value=”zh-CN” type=”hidden”>
<input name=”ie” value=”GB2312″ type=”hidden”>
<input onfocus=”if( this.value==’用 Google 搜索活动目录管理日志) {this.value=” };” size=”25″ name=”q” id=”query” value=”用 Google 搜索活动目录管理日志” type=”text”>
<input name=”Search” value=”搜索” attr=”value” type=”submit”>
</form>

记住,要把上例中的”hulucat.com” 换成您的网站网址哦!现在,用用你的搜索吧。
如果您的中文搜索送到 Google 后成了乱码,那可能是您的 ie 值设定不合您的网页编码造成的。

如果我的网站不是 GB2313 编码怎么办?
由于在中国很多网站使用的是 GB2313 编码,因此上例中用
<input name=”ie” value=”GB2312″ type=”hidden”>
告知 Google 此搜索是从你的 GB2312 编码网页而来,如果你的网页不是用 GB2312 编码而是使用 UTF-8 编码,那请把该行换成:
<input name=”ie” value=”UTF-8″ type=”hidden”>
如果你的网页编码是使用繁体中文的 Big5 编码,那请把该行换成
<input name=”ie” value=”Big5″ type=”hidden”>

如何使用 Google 用 GB2313 编码显示搜索结果?
在一般如上的情况下,Google 是用 UTF-8 编码显示搜索结果的,如果你要 Google 用 GB2312 编码显示搜索结果,那么你可以加入下列这一行
<input name=”oe” value=”GB2312″ type=”hidden”>
同理,使用下一行会使 Google 用 Big5 编码显示搜索结果
<input name=”oe” value=”Big5″ type=”hidden”>

如何使 Google 用繁体中文显示操作信息?
以上的设定会让 Google 用简体中文显示操作信息,如果你要 Google 用繁体中文显示操作信息那请你把
<input name=”hl” value=”zh-CN” type=”hidden”>
改成
<input name=”hl” value=”zh-TW” type=”hidden”> 即可。

参数参考:
name=”sitesearch” :告知 Google 你要搜索的指定网站或指定域名
name=”ie”:告知 Google 发送搜索词的网页编码,预设值为”UTF-8″,由于在中国很多网站是使用 GB2312 编码
name =”oe” :告知 Google 显示搜索的网页编码,预设值为”UTF-8″,由于现代大部分机器都能支持”UTF-8″无误,因此你大概不需要调整次参数;
name =”hl” :告知 Google 显示搜索的网页语言。”zh-CN”为简体中文,”zh-TW”为繁体中文,”en”为英文。