wget 命令用法

  • A+
所属分类:linux技术
摘要

参考:https://www.jianshu.com/p/59bb131bc2ab


wget 命令用法

1. 用法

wget  [OPTION]...  [URL]... 

2. 常用参数

  • 启动:
-V,  --version                   # 显示 Wget 的版本信息并退出 -h,  --help                      # 打印帮助 -b,  --background                # 启动后转入后台 
  • 记录和输入文件:
-o,  --output-file=FILE          # 将日志信息写入【FILE】 -a,  --append-output=FILE        # 将信息添加至【FILE】 -q,  --quiet                     # 安静模式 (无信息输出) -v,  --verbose                   # 详细输出 (默认) -nv, --no-verbose                # 关闭详细输出,但不进入安静模式 -i,  --input-file=FILE           # 下载本地或外部 [FILE] 中的 URL 
  • 下载:
-t,  --tries=NUMBER              # 设置重试次数为【NUMBER】(0 代表无限制)      --retry-connrefused         # 即使拒绝连接也重试 -O,  --output-document=FILE      # 将文档写入【FILE】(可以理解为把下载的文件重命名改为【FILE】) -nc, --no-clobber                # 不要下载已存在文件 -c,  --continue                  # 断点续传下载文件(继续获取部分下载) -N,  --timestamping              # 只获取比本地文件新的文件 -S,  --server-response           # 打印服务器响应头信息      --spider                    # 不下载任何文件      --limit-rate=RATE           # 限制下载速率为 [RATE]      --ignore-case               # 匹配文件/目录时忽略大小写      --user=USER                 # 将 ftp 和 http 的用户名均设置为【USER】      --password=PASS             # 将 ftp 和 http 的密码均设置为【PASS】      --ask-password              # 提示输入密码 
  • 目录:
-nd, --no-directories            # 不创建目录(默认) -x,  --force-directories         # 强制创建目录  	## 下面的参数需要配合 "-x" 参数使用 -nH, --no-host-directories       # 不要创建主机(www.cnglogs.com)目录      --protocol-directories      # 在目录中使用协议名称(从https开始创建目录) -P,  --directory-prefix=PREFIX   # 保存文件到指定的【PREFIX】目录      --cut-dirs=NUMBER           # 忽略远程目录中【NUMBER】个目录层。 
  • HTTP选项:
--http-user=USER            # 设置 http 用户名为【USER】 --http-password=PASS        # 设置 http 密码为【PASS】 --no-cache                  # 不使用服务器缓存的数据。 --default-page=NAME         # 改变默认页名称 (通常是“index.html”) --no-cookies                # 不使用 cookies --save-cookies=FILE         # 会话结束后保存 cookies 至【FILE】 
  • HSTS选项:
--no-hsts                   # 禁用 HSTS --hsts-file                 # HSTS 数据库路径(将覆盖默认值) 
  • FTP选项:
--ftp-user=USER             # 设置 ftp 用户名为【USER】 --ftp-password=PASS         # 设置 ftp 密码为【PASS】 --no-glob                   # 不在 FTP 文件名中使用通配符展开 --preserve-permissions      # 保留远程文件的权限 --retr-symlinks             # 递归目录时,获取链接的文件 (而非目录) 
  • 递归下载:
-r,  --recursive            # 指定递归下载 -l,  --level=NUMBER         # 最大递归深度 (inf 或 0 代表无限制,即全部下载)。      --delete-after         # 下载完成后删除本地文件      --backups=N            # 写入文件 X 前,轮换移动最多 N 个备份文件 -K,  --backup-converted     # 在转换文件 X 前先将它备份为 X.orig 
  • 递归接受/拒绝:
-A,  --accept=LIST          # 逗号分隔的可接受的扩展名列表 -R,  --reject=LIST          # 逗号分隔的要拒绝的扩展名列表 -D,  --domains=LIST              # 逗号分隔的可接受的域名列表      --exclude-domains=LIST      # 逗号分隔的要拒绝的域名列表 -I,  --include-directories=LIST  # 允许目录的列表 -X,  --exclude-directories=LIST  # 排除目录的列表 -np, --no-parent                 # 不追溯至父目录 

3. 使用实例

  • 下载单个文件/网页
wget https://www.rarlab.com/rar/rarlinux-6.0.1.tar.gz	# 下载rarlinux-6.0.1.tar.gz文件 wget https://www.rarlab.com/download.htm		# 下载 download.htm 网页	 
  • 将下载的文件名改为指定文件名 (参数 “O” )
wget -O yx.html https://app.yinxiang.com/Home.action # 默认下载保存的文件为“Home.action” # 使用 -O 参数后,保存的文件为指定文件名,这里是“yx.html” 
  • 断点下载(参数 “c” )
# 这个参数适合下载大文件,网速不理想的场景 # 借助参数 "c", 可以继续从文件中断的地方继续下载 wget -c https://www.rarlab.com/rar/rarlinux-6.0.1.tar.gz 
  • 后台下载(参数 “b”)
# 对于下载大文件时,我们可以使用参数 “b”,将进程切换到后台下载 # 切换后台下载后,我们可以通过 “wget-log”查看下载进度 wget -b https://www.rarlab.com/rar/rarlinux-6.0.1.tar.gz 
  • 自动下载多个文件(参数 “i”)
# 自定义一个文件URLlist.txt,将需要下载的URL都输入进去,然后使用参数 “i”指定改文件即可 wget -i URLlist.txt 
  • 检查网页是否可访问,而不用下载(“S“:打印响应信息,“spaider”:不下载)
wget -S --spaider https://www.cnblogs.com/cure/ 
  • 指定文件格式下载(“A” 指定下载文件格式,“R”指定忽略下载文件格式)
wget -A *.pdf url 	或 wget --accept=LIST url wget -R *.gif url 	或 wget --reject=LIST url # LIST表示可以指定多个格式 
  • 指定用户名密码下载
# 此场景适合部分访问需要用户名和密码验证的 URL下载 wget --user=USER --password=PASS URL	 # 此方式密码明文显示 wget --user=USER --ask-password URL	 # 此方式密码是按回车后,提示输入密码,密码不显示(推荐)  

参考:

https://www.jianshu.com/p/59bb131bc2ab