1.背景

需要下载网站目录下的某个问题或所有文件。

2.方案

2.1下载单个文件

wget wget -P /home/user/test http://www.xxx.com --no-check-certificate

各个参数的含义:

-r:递归,遍历所有子目录

-c:指定断点续传功能(默认具有断点续传功能,ftp工具下载才需要,默认功能)

-nc:不下载已经存在的文件

-np:表示不追溯至父目录,不跟随链接,只下载指定目录及子目录里的东西();

-nH:不要将文件保存到主机名文件夹

-p:指定下载目录

-k:修复下载文件中的绝对连接为相对连接(将下载的网页里的链接修改为本地链接.)

-e robots=off:忽略robots.txt

-L:递归时不进入其它主机

-R index.html:不下载 index.html 文件

2.2下载所有文件

功能:将目录下所有文件遍历并下载至本地。

wget -r -np -nH -R index.html http://url/

各个参数的含义:

-r:遍历所有子目录

-np:不到上一层子目录去

-nH:不要将文件保存到主机名文件夹

-R index.html:不下载index.html文件

3.其他

若网站目录设置成“403”状态(禁止访问),此命令将失效。

由于此命令可下载整个目录下的所有静态文件,包括数据库sqlite、access等,所以很危险,不要存放重要文件。