阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

一文学会curl和curl详解

238次阅读
没有评论

共计 9152 个字符,预计需要花费 23 分钟才能阅读完成。

# 什么是 curl

cURL 是一个利用 URL 语法在命令行下工作的文件传输工具,1997 年首次发行。它支持文件上传和下载,所以是综合传输工具,但按传统,习惯称 cURL 为下载工具。

你可以把 CURL 想象成一个精简的命令行网页浏览器。它支持几乎你能想到的所有协议,可以交互访问几乎所有在线内容。唯一和浏览器不同的是,cURL 不会渲染接收到的相应信息。curl 和 wget 类似也支持上传下载等感觉比 wget 更强大,但我觉得用途方面更偏重于模拟网络请求,而下载方面我更喜欢用 wget,curl 的用法也和 wget 类似!

cURL 支持的通信协议有 FTP、FTPS、HTTP、HTTPS、TFTP、SFTP、Gopher、SCP、Telnet、DICT、FILE、LDAP、LDAPS、IMAP、POP3、SMTP 和 RTSP。

一文学会 curl 和 curl 详解

# 常用参数

 获取帮助:curl --help
参数 描述
-I/–head 只显示传输文档,经常用于测试连接本身
-o/–output 把输出写到该文件中,必须输入保存文件名
-O/–remote-name 把输出写到该文件中,保留远程文件的文件名
-F/–form 模拟表单提交
-s/–silent 静默模式,不输出任何东西
-S/–show-error 显示错误,在选项 -s 中,当 curl 出现错误时将显示
-L/–location 跟踪重定向
-f/–fail 不输出错误
-n/–netrc 从 netrc 文件中读取用户名和密码
–netrc-optional 使用 .netrc 或者 URL 来覆盖 -n
–ntlm 使用 HTTP NTLM 身份验证
-N/–no-buffer 禁用缓冲输出
-p/–proxytunnel 使用 HTTP 代理
–proxy-anyauth 选择任一代理身份验证方法
–proxy-basic 在代理上使用基本身份验证
–proxy-digest 在代理上使用数字身份验证
–proxy-ntlm 在代理上使用 ntlm 身份验证
-P/–ftp-port 使用端口地址,而不是使用 PASV
-M/–manual 显示全手动
-Q/–quote 文件传输前,发送命令到服务器
-r/–range 检索来自 HTTP/1.1 或 FTP 服务器字节范围
–range-file 读取(SSL)的随机文件
-R/–remote-time 在本地生成文件时,保留远程文件时间
–retry 传输出现问题时,重试的次数
–retry-delay 传输出现问题时,设置重试间隔时间
–retry-max-time 传输出现问题时,设置最大重试时间
–socks4 用 socks4 代理给定主机和端口
–socks5 用 socks5 代理给定主机和端口
-t/–telnet-option Telnet 选项设置
–trace 对指定文件进行 debug
–trace-ascii Like 跟踪但没有 hex 输出
–trace-time 跟踪 / 详细输出时,添加时间戳
-T/–upload-file 上传文件
-u/–user 设置服务器的用户和密码
-U/–proxy-user 设置代理用户名和密码
-V/–version 显示版本信息
-w/–write-out [format] 什么输出完成后
-x/–proxy 在给定的端口上使用 HTTP 代理
-X/–request 指定什么命令
-y/–speed-time 放弃限速所要的时间。默认为 30
-Y/–speed-limit 停止传输速度的限制,速度时间 ’ 秒
-z/–time-cond 传送时间设置
-0/–http1.0 使用 HTTP 1.0
-1/–tlsv1 使用 TLSv1(SSL)
-2/–sslv2 使用 SSLv2 的(SSL)
-3/–sslv3 使用的 SSLv3(SSL)
–3p-quote like -Q for the source URL for 3rd party transfer
–3p-url 使用 url,进行第三方传送
–3p-user 使用用户名和密码,进行第三方传送
-4/–ipv4 使用 IP4
-6/–ipv6 使用 IP6
-#/–progress-bar 用进度条显示当前的传送状态

# 常用参数分类

# 调试类
-v, --verbose                          输出信息
-q, --disable                          在第一个参数位置设置后 .curlrc 的设置直接失效,这个参数会影响到 -K, --config -A, --user-agent -e, --referer
-K, --config FILE                      指定配置文件
-L, --location                         跟踪重定向 (H)

# CLI 显示设置
-s, --silent                           Silent 模式。不输出任务内容
-S, --show-error                       显示错误. 在选项 -s 中,当 curl 出现错误时将显示
-f, --fail                             不显示 连接失败时 HTTP 错误信息
-i, --include                          显示 response 的 header (H/F)
-I, --head                             仅显示 响应文档头
-l, --list-only                        只列出 FTP 目录的名称 (F)
-#, --progress-bar                     以进度条 显示传输进度

# 数据传输类
-X, --request [GET|POST|PUT|DELETE|…]  使用指定的 http method 例如 -X POST
-H, --header <header>                  设定 request 里的 header 例如 -H "Content-Type: application/json"
-e, --referer                          设定 referer (H)
-d, --data <data>                      设定 http body 默认使用 content-type application/x-www-form-urlencoded (H)
    --data-raw <data>                  ASCII 编码 HTTP POST 数据 (H)
    --data-binary <data>               binary 编码 HTTP POST 数据 (H)
    --data-urlencode <data>            url 编码 HTTP POST 数据 (H)
-G, --get                              使用 HTTP GET 方法发送 -d 数据 (H)
-F, --form <name=string>               模拟 HTTP 表单数据提交 multipart POST (H)
    --form-string <name=string>        模拟 HTTP 表单数据提交 (H)
-u, --user <user:password>             使用帐户,密码 例如 admin:password
-b, --cookie <data>                    cookie 文件 (H)
-j, --junk-session-cookies             读取文件中但忽略会话 cookie (H)
-A, --user-agent                       user-agent 设置 (H)

# 传输设置
-C, --continue-at OFFSET               断点续转
-x, --proxy [PROTOCOL://]HOST[:PORT]   在指定的端口上使用代理
-U, --proxy-user USER[:PASSWORD]       代理用户名及密码

# 文件操作
-T, --upload-file <file>               上传文件
-a, --append                           添加要上传的文件 (F/SFTP)

# 输出设置
-o, --output <file>                    将输出写入文件,而非 stdout
-O, --remote-name                      将输出写入远程文件
-D, --dump-header <file>               将头信息写入指定的文件
-c, --cookie-jar <file>                操作结束后,要写入 Cookies 的文件位置

# 常用 curl 实例

通用语法:

curl [option] [URL...] 在处理 URL 时其支持类型于 SHELL 的名称扩展功能

# 1. 查看源码

直接 curl 网址,源码就会打印在命令行上

curl www.baidu.com

# 2. 保存成文件 (-O)

- O 参数将服务器回应保存成文件,并将 URL 的最后部分当作文件名。

curl -o home.html  http://www.sina.com.cn

- o 参数将服务器的回应保存成文件,等同于 wget 命令。

curl -o example.html https://www.example.com

# 3. 显示网页头部信息 (-i)

用 -i, 也会把网页信息显示出来

# curl -i www.baidu.com

使用 -I 发起 head 请求
curl -I https://www.xgss.net/demo

# 4. 显示通信的过程 (-v)

详细显示请求响应相关信息

curl -v www.baidu.com

# 5. 详细的通信信息 (–trance)

文件名 url, 具体信息保存到单独的文件中

curl --trace info.txt www.baidu.com

# 6. 指定请求方法(-X)

- X 参数指定 HTTP 请求的方法。

http 的动作,例如 GET POST,PUT,DELETE 等, 需要参数

curl -X POST www.baidu.com
curl -X POST --data "data=xxx" example.com/form.cgi

POST 发送请求的数据体可以用 -d

curl -X POST -d'login=emma&password=123' https://baidu.com/login

curl -X POST -d 'login=emma' -d 'password=123' https://baidu.com/login

使用 - d 参数以后,HTTP 请求会自动加上标头 Content-Type : application/x-www-form-urlencoded。并且会自动将请求转为 POST 方法,因此可以省略 -X POST。- d 参数可以读取本地文本文件的数据,向服务器发送。

curl -d 'data.txt' https://baidu.com/login

# 7. 页面来源 (–referer)

使用参数表示的是你从哪个页面来的

curl --referer www.baidu.com www.xgss.net
curl 访问 www.xgss.net,referer 是 www.baidu.com

-e 参数用来设置 HTTP 的标头 Referer,表示请求的来源。

curl -e 'https://google.com?q=example' https://www.xgss.net/?st7
nginx 日志:GET /?st7 HTTP/1.1 - 200 - curl/7.29.0 - www.xgss.net - from:https://google.com?q=example - POST:- - COOKIE:-

# 8. 伪造 User Agent(-A)

User Agent 字段,这个字段表示的是客户端设备的信息,服务器可能会根据这个 User Agent 字段来判断是手机还是电脑

–user-agent 可以用 - A 或者 - H 来替代

curl --user-agent "$UA" url

比如 IPhone 
Mozilla/5.0 (iPhone; U; CPU iPhone OS 4_3_3 like Mac OS X; en-us) AppleWebKit/533.17.9 (KHTML, like Gecko) Version/5.0.2 Mobile/8J2 Safari/6533.18.5

命令:# UA='Mozilla/5.0 (iPhone; U; CPU iPhone OS 4_3_3 like Mac OS X; en-us) AppleWebKit/533.17.9 (KHTML, like Gecko) Version/5.0.2 Mobile/8J2 Safari/6533.18.5'
# curl --user-agent "$UA" www.xgss.net?s8
nginx 日志:GET /?s8 HTTP/1.1 - 200 - Mozilla/5.0 (iPhone; U; CPU iPhone OS 4_3_3 like Mac OS X; en-us) AppleWebKit/533.17.9 (KHTML, like Gecko) Version/5.0.2 Mobile/8J2 Safari/6533.18.5 - www.xgss.net - from:- - POST:- - COOKIE:-
curl --cookie "name=xxx" www.xgss.net?s9

`-c cookie-file` 可以保存服务器返回的 cookie 到文件,`-b cookie-file` 可以使用这个文件作为 cookie 信息,进行后续的请求。nginx 日志:GET /?s9 HTTP/1.1 - 200 - curl/7.29.0 - www.xgss.net - from:- - POST:- - COOKIE:name=xxx

# 10. 增加头部信息 (-H)

使用 –header 或者 - H 参数添加 HTTP 请求的标头。

curl --header "Content-Type:application/json" https://www.xgss.net/?s10

curl -H 'Accept-Language: en-US' -H 'Secret-Message: xyzzy' https://google.com

# 11. 发起 get 请求并发送数据 (-G -d)

curl -G -d "hello" -v https://www.xgss.net/?s11

nginx 日志:GET /?s11&hello HTTP/1.1 - 200 - curl/7.29.0 - www.xgss.net - from:- - POST:- - COOKIE:-

# 12. 模拟用户登录 (-u)

使用 -u 提供用户名密码,或者 –user

# 此参数相当于设置 http 头 Authorization:
curl --user user:password https://www.xgss.net/login.php
# 使用用户名、密码认证,此参数会覆盖“-n”、“--netrc”和“--netrc-optional”选项

curl http://admin:admin@localhost:9002/actuator

使用 -c 保存服务端响应的 cookie

curl -u 'admin:admin' -c cookie.txt http://localhost:9002/actuator
curl -b ./cookie_c.txt  http://blog.mydomain.com/wp-admin

# 15. 模拟模拟登录 (-D)

-c(小写) 产生的 cookie 和 - D 里面的 cookie 是不一样的

curl -D ./cookie_D.txt -F log=aaaa -F pwd=****** http://blog.mydomain.com/login.php

# 16. 断点续传 (-C)

curl -C -O https://www.xgss.net/?s16

# 17. 传送数据 (-d)

- d 参数用于发送 POST 请求的数据体

最好用登录页面测试,因为你传值过去后,回抓数据,你可以看到你传值有没有成功

curl -d log=aaaa  https://www.xgss.net/wp-login.php?s17

登录服务器查看日志:POST /wp-login.php?s1 HTTP/1.1 - 302 - curl/7.29.0 - www.xgss.net - from:- - POST:log=aaaa - COOKIE:-

模拟登录:curl  -d "username=admin&password=123456" https://baidu.com/login/

# 18. 显示抓取错误 (-f)

curl -f https://www.xgss.net/asdf
curl: (22) The requested URL returned error: 404 Not Found

# 19. 代理访问 (-x)

当我们经常用 curl 去搞人家东西的时候,人家会把你的 IP 给屏蔽掉的, 这个时候, 我们可以用代理

curl -x 10.10.90.83:80 -o home.html https://www.xgss.net/?s19

curl -x socks5://james:cats@myproxy.com:8080 https://www.example.com

如果没有指定代理协议,默认为 HTTP

curl -x james:cats@myproxy.com:8080 https://www.example.com

# 20. 分段下载

比较大的东西,我们可以分段下载

curl -r 0-100 -o img.part1 http://mydomian.cn/thumb/xxx.jpg
  % Total    % Received % Xferd  Average Speed  Time    Time    Time  Current
                                Dload  Upload  Total  Spent    Left  Speed
100  101  100  101    0    0  1926      0 --:--:-- --:--:-- --:--:--    0
curl -r 100-200 -o img.part2 http://mydomian.cn/thumb/xxx.jpg
  % Total    % Received % Xferd  Average Speed  Time    Time    Time  Current
                                Dload  Upload  Total  Spent    Left  Speed
100  101  100  101    0    0  3498      0 --:--:-- --:--:-- --:--:--  98k
curl -r 200- -o img.part3 http://mydomian.cn/thumb/xxx.jpg
  % Total    % Received % Xferd  Average Speed  Time    Time    Time  Current
                                Dload  Upload  Total  Spent    Left  Speed
100 13515  100 13515    0    0  154k      0 --:--:-- --:--:-- --:--:--  280k
ll |grep img.part

用的时候,把他们 cat 一下就 OK 了,cat img.part* >img.jpg

# 21. 不错误和进度 (-s)

- s 参数将不输出错误和进度信息。

curl -s https://www.example.com

- S 参数指定只输出错误信息,通常与 - s 一起使用。

$ curl -s -o /dev/null https://google.com

# 22. 显示下载进度条 (-#)

curl -# -O  http://www.mydomain.com/linux/25002_3.html
######################################################################## 100.0%

# 23. 通过 ftp 下载文件

curl -u 用户名: 密码 -O http://blog.mydomain.com/demo/curtain/bbstudy_files/style.css
% Total    % Received % Xferd  Average Speed  Time    Time    Time  Current
Dload  Upload  Total  Spent    Left  Speed
101  1934  101  1934    0    0  3184      0 --:--:-- --:--:-- --:--:--  7136
或者用下面的方式
curl -O ftp://xukai:test@192.168.242.144:21/www/focus/enhouse/index.php
  % Total    % Received % Xferd  Average Speed  Time    Time    Time  Current
                                Dload  Upload  Total  Spent    Left  Speed
100 87518  100 87518    0    0  2312k      0 --:--:-- --:--:-- --:--:-- 11.5M

# 24. 通过 ftp 上传 (-T)

-T localfile 向服务器 PUT 文件

curl -T xukai.php ftp://xukai:test@192.168.242.144:21/www/focus/enhouse/
  % Total    % Received % Xferd  Average Speed  Time    Time    Time  Current
                                Dload  Upload  Total  Spent    Left  Speed
100 87518    0    0  100 87518      0  2040k --:--:-- --:--:-- --:--:-- 8901k

# 25. 跳过 SSL 检测 (-k)

- k 参数指定跳过 SSL 检测。

curl -k https://www.xgss.net

# 26. 跟随服务器的重定向 (-L)

- L 参数会让 HTTP 请求跟随服务器的重定向。curl 默认不跟随重定向。

curl -L -d 'tweet=hi' https://api.twitter.com/tweet

# 27. 限速下载

--limit-rate 用来限制 HTTP 请求和回应的带宽,模拟慢网速的环境。

$ curl --limit-rate 200k https://google.com

# 高级下载功能

# 1. 循环下载 (-O)

$curl -O http://mydomain.net/~zzh/screen[1-10].JPG

# 2. 循环(匹配)下载

$curl -O http://mydomain.net/~{zzh,nick}/[001-201].JPG  # >like zzh/001.JPG

# 3. 循环(引用)下载

$ curl -o #2_#1.jpg http://mydomain.net/~{zzh,nick}/[001-201].JPG # like >001_zzh.jpg

$ curl http://www.jbxue.com/archive[1996-1999]/vol[1-4]/part{a,b,c}.html 可以生成多个期望的 URL

# 4. 断点续传 (-c -O)

$curl -c -O http://mydomain.net/~zzh/screen1.JPG

# 5. 分块下载 (-r)

$curl -r  0 -10240  -o "zhao.part1"  http://mydomain.net/~zzh/zhao1.mp3 &\
$curl -r 10241 -20480  -o "zhao.part1"  http://mydomain.net/~zzh/zhao1.mp3 &\
$curl -r 20481 -40960  -o "zhao.part1"  http://mydomain.net/~zzh/zhao1.mp3 &\
$curl -r 40961 - -o  "zhao.part1"  http://mydomain.net/~zzh/zhao1.mp3
...
$cat zhao.part* > zhao.mp3

# 6. 模拟 http basic auth 登录配置密码

curl 命令模拟 http basic auth 登录基本格式:

curl --basic -u users:passwd  https://www.xgss.net

# 7. 绕过 CDN 指定源站访问

实现绑定 hosts 访问

curl -voa https://www.xgss.net -x 1.2.3.4:80

正文完
星哥说事-微信公众号
post-qrcode
 
星锅
版权声明:本站原创文章,由 星锅 2022-05-17发表,共计9152字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中