从今天开始,贝壳每周介绍一些小软件,作为基础的电脑知识普及。软件可能是Windows的,也可能是Linux的,要点是轻巧好用。由于是简介,不会写的太详细。想要看专业介绍的,会给出Reference。

今天介绍的软件就是wget[1]。这个是*nix下的下载软件,也有windows移植[2]。现在可以运行在任何一种POSIX系统上。软件是GPL版权的,属于GNU开源组织的核心代码,也是GNU组织的几大招牌之一(最出名的是GCC)。如果要看详细的资料,请看这里[3],可惜是英文的。

wget是*nix时代出名的下载软件,以稳定和通用出名。主要针对http和ftp协议的文件下载,拥有很多配置选项和能力。其中比较有名的是链接跟随,这种能力可以跟踪html内的链接。例如将所有链接所需的文件下载到本地,并且修改链接地址,即抓取完整页面文件。跟随链接抓取多重页面(网络蜘蛛)。

wget不支持多线程下载,但是支持断点续传。最常用的用法是wget -c [URL]。如果没有文件就直接下载,有文件就尝试续传。如果没有文件重试次数的指定,几乎就是无限制的下载。下载非常稳定,就算每小时下载10字节都不会断线。

和今天的GUI多线程,甚至带P2P的下载软件相比,wget无疑是非常单薄的。然而由于是基于命令行的,而且非常稳定,因此经常被用于脚本语言中。例如bash或者python,用于下载网络文件后的处理。windows中的很多脚本也可以用这个软件来下载网络文件,非常方便。

Reference:

  1. GNU Wget: http://www.gnu.org/software/wget/

  2. Wget for Windows: http://gnuwin32.sourceforge.net/packages/wget.htm

  3. GNU Wget Manual: http://www.gnu.org/software/wget/manual