Wget

364次阅读

wget [参数列表] [目标软件、网页的网址]

-V,–version 显示软件版本号然后退出;

-h,–help显示软件帮助信息;

-e,–execute=COMMAND 执行一个 “.wgetrc”命令

-o,–output-file=FILE 将软件输出信息保存到文件;

-a,–append-output=FILE将软件输出信息追加到文件;

-d,–debug显示输出信息;

-q,–quiet 不显示输出信息;

-i,–input-file=FILE 从文件中取得URL;

-t,–tries=NUMBER 是否下载次数(0表示无穷次)

-O –output-document=FILE下载文件保存为别的文件名

-nc, –no-clobber 不要覆盖已经存在的文件

-N,–timestamping只下载比本地新的文件

-T,–timeout=SECONDS 设置超时时间

-Y,–proxy=on/off 关闭代理

-nd,–no-directories 不建立目录

-x,–force-directories 强制建立目录

–http-user=USER设置HTTP用户

–http-passwd=PASS设置HTTP密码

–proxy-user=USER设置代理用户

–proxy-passwd=PASS设置代理密码

-r,–recursive 下载整个网站、目录(小心使用)

-l,–level=NUMBER 下载层次

-A,–accept=LIST 可以接受的文件类型

-R,–reject=LIST拒绝接受的文件类型

-D,–domains=LIST可以接受的域名

–exclude-domains=LIST拒绝的域名

-L,–relative 下载关联链接

–follow-ftp 只下载FTP链接

-H,–span-hosts 可以下载外面的主机

-I,–include-directories=LIST允许的目录

-X,–exclude-directories=LIST 拒绝的目录

wget是Linux下的一个很有用的一个下载网上资源的命令。

wget的使用形式是:

wget [参数列表] URL

首先来介绍一下wget的主要参数:

· -b:让wget在后台运行,记录文件写在当前目录下”wget-log”文件中;

· -t [nuber of times]:尝试次数,当wget无法与服务器建立连接时,尝试连接多少次

。比如”-t

120″表示尝试120次。当这一项为”0″的时候,指定尝试无穷多次直到连接成功为止,这个 设置非常有用,当对方服务器突然关机或者网络突然中断的时候,可以在恢复正常后继续 下载没有传完的文件;

·

-c:断点续传,这也是个非常有用的设置,特别当下载比较大的文件的时候,如果中

途意外中断,那么连接恢复的时候会从上次没传完的地方接着传,而不是又从头开始,使

用这一项需要远程服务器也支持断点续传,一般来讲,基于UNIX/Linux的Web/FTP服务器

都支持断点续传;

· -T [number of seconds]:超时时间,指定多长时间远程服务器没有响应就中断连接

,开始下一次尝试。比如”-T 120″表示如果120秒以后远程服务器没有发过来数据,就重新尝试连接。如果网络速度比 较快,这个时间可以设置的短些,相反,可以设置的长一些,一般最多不超过900,通常 也不少于60,一般设置在120左右比较合适;

· -w [number of seconds]:在两次尝试之间等待多少秒,比如”-w 100″表示两次尝试 之间等待100秒;

· -Y on/off:通过/不通过代理服务器进行连接;

· -Q [byetes]:限制下载文件的总大小最多不能超过多少,比如”-Q2k”表示不能超过2K 字节,”-Q3m”表示最多不能超过3M字节,如果数字后面什么都不加,就表示是以字节为单 位,比如”-Q200″表示最多不能超过200字节;

· -nd:不下载目录结构,把从服务器所有指定目录下载的文件都堆到当前目录里;

· -x:与”-nd”设置刚好相反,创建完整的目录结构,例如”wget -nd http://www.gnu.org“将创建在当前目录下创建”www.gnu.org“子目录,然后按照服务器 实际的目录结构一级一级建下去,直到所有的文件都传完为止;

· -nH:不创建以目标主机域名为目录名的目录,将目标主机的目录结构直接下到当前目 录下;

· –http-user=username

· –http-passwd=password:如果Web服务器需要指定用户名和口令,用这两项来设定;

· –proxy-user=username

· –proxy-passwd=password:如果代理服务器需要输入用户名和口令,使用这两个选项 ;

· -r:在本机建立服务器端目录结构;

· -l [depth]:下载远程服务器目录结构的深度,例如”-l 5″下载目录深度小于或者等 于5以内的目录结构或者文件;

· -m:做站点镜像时的选项,如果你想做一个站点的镜像,使用这个选项,它将自动设 定其他合适的选项以便于站点镜像;

· -np:只下载目标站点指定目录及其子目录的内容。这也是一个非常有用的选项,我们 假设某个人的个人主页里面有一个指向这个站点其他人个人主页的连接,而我们只想下载 这个人的个人主页,如果不设置这个选项,甚至–有可能把整个站点给抓下来,这显然是

我们通常不希望的;

ü 如何设定wget所使用的代理服务器

wget

可以使用用户设置文件”.wgetrc”来读取很多设置,我们这里主要利用这个文件来是

设置代理服务器。使用者用什么用户登录,那么什么用户主目录下的”.wgetrc”文件就起

作用。例如,”root”用户如果想使用”.wgetrc”来设置代理服务器,”/root/.wgert”就起

作用,下面给出一个”.wge trc”文件的内容,读者可以参照这个例子来编写自己的”wgetrc”文件:

http-proxy = 111.111.111.111:8080

ftp-proxy = 111.111.111.111:8080

这两行的含义是,代理服务器IP地址为:111.111.111.111,端口号为:80。第一行指定

HTTP协议所使用的代理服务器,第二行指定FTP协议所使用的代理服务器。

正文完