亲宝软件园·资讯

展开

php curl采集图片 php curl简单采集图片生成base64编码(并附curl函数参数说明)

摘取天上星 人气:0

许多年前的代码突然拿来一用,特做此笔记(此处的code用来定位内部错误位置,非http code)

<?php 
$url="http://c.hiphotos.baidu.com/image/w%3D210/sign=ed30880babec8a13141a50e1c7029157/d52a2834349b033be1a9503e17ce36d3d539bd35.gif";
function curl_url($url,$type=0,$timeout=30){
 $msg = ['code'=>2100,'status'=>'error','msg'=>'未知错误!'];
 $imgs= ['image/jpeg'=>'jpeg',
        'image/jpg'=>'jpg',
        'image/gif'=>'gif',
        'image/png'=>'png',
        'text/html'=>'html',
        'text/plain'=>'txt',
        'image/pjpeg'=>'jpg',
        'image/x-png'=>'png',
        'image/x-icon'=>'ico'
  ];
 if(!stristr($url,'http')){
 $msg['code']= 2101;
 $msg['msg'] = 'url地址不正确!'; 
 return $msg;
 } 
 $dir= pathinfo($url);
 //var_dump($dir);
 $host = $dir['dirname'];
 $refer= $host.'/';
 $ch = curl_init($url);
 curl_setopt ($ch, CURLOPT_REFERER, $refer); //伪造来源地址
 curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);//返回变量内容还是直接输出字符串,0输出,1返回内容
 curl_setopt($ch, CURLOPT_BINARYTRANSFER, 1);//在启用CURLOPT_RETURNTRANSFER的时候,返回原生的(Raw)输出
 curl_setopt($ch, CURLOPT_HEADER, 0); //是否输出HEADER头信息 0否1是
 curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout); //超时时间
 $data = curl_exec($ch);
 //$httpCode = curl_getinfo($ch,CURLINFO_HTTP_CODE); 
 //$httpContentType = curl_getinfo($ch,CURLINFO_CONTENT_TYPE);
 $info = curl_getinfo($ch);
 curl_close($ch);
 $httpCode = intval($info['http_code']);
 $httpContentType = $info['content_type'];
 $httpSizeDownload= intval($info['size_download']);
 if($httpCode!='200'){
 $msg['code']= 2102;
 $msg['msg'] = 'url返回内容不正确!';
 return $msg;
 }
 if($type>0 && !isset($imgs[$httpContentType])){
 $msg['code']= 2103;
 $msg['msg'] = 'url资源类型未知!';
 return $msg;
 }
 if($httpSizeDownload<1){
 $msg['code']= 2104;
 $msg['msg'] = '内容大小不正确!';
 return $msg;
 }
 $msg['code'] = 200;
 $msg['status']='success';
   $msg['msg']  = '资源获取成功';
 if($type==0 or $httpContentType=='text/html') $msg['data'] = $data;
 $base_64 = base64_encode($data);
 if($type==1) $msg['data'] = $base_64;
 elseif($type==2) $msg['data'] = "data:{$httpContentType};base64,{$base_64}";
 elseif($type==3) $msg['data'] = "<img src='data:{$httpContentType};base64,{$base_64}' />";
 else $msg['msg'] = '未知返回需求!'; 
 unset($info,$data,$base_64);
 return $msg;
}
$msg = curl_url($url,3);
if($msg['status']=='success') echo $msg['data'];
die;
?>

输出效果如下:

下面是部分curl函数参数说明:

CURL库方法
名称 说明
curl_close 关闭一个curl会话
curl_copy_handle 拷贝一个curl连接资源的所有内容和参数
curl_errno 返回一个包含当前会话错误信息的数字编号
curl_error 返回一个包含当前会话错误信息的字符串
curl_exec 执行一个curl会话
curl_getinfo 获取一个curl连接资源句柄的信息
curl_init 初始化一个curl会话
curl_multi_add_handle 向curl批处理会话中添加单独的curl句柄资源
curl_multi_close 关闭一个批处理句柄资源
curl_multi_exec 解析一个curl批处理句柄
curl_multi_getcontent 返回获取的输出的文本流
curl_multi_info_read 获取当前解析的curl的相关传输信息
curl_multi_init 初始化一个curl批处理句柄资源
curl_multi_remove_handle 移除curl批处理句柄资源中的某个句柄资源
curl_multi_select Get all the sockets associated with the cURL extension, which can then be "selected"
curl_setopt_array 以数组的形式为一个curl设置会话参数
curl_setopt 为一个curl设置会话参数
curl_version 获取curl相关的版本信息

curl_setopt()参数
名称 说明
CURLOPT_INFILESIZE 当你上传一个文件到远程站点,这个选项告诉PHP你上传文件的大小。
CURLOPT_VERBOSE 如果你想CURL报告每一件意外的事情,设置这个选项为一个非零值。
CURLOPT_HEADER 如果你想把一个头包含在输出中,设置这个选项为一个非零值。
CURLOPT_NOPROGRESS 如果你不会PHP为CURL传输显示一个进程条,设置这个选项为一个非零值。注意:PHP自动设置这个选项为非零值,你应该仅仅为了调试的目的来改变这个选项。
CURLOPT_NOBODY 如果你不想在输出中包含body部分,设置这个选项为一个非零值。
CURLOPT_FAILONERROR 如果你想让PHP在发生错误(HTTP代码返回大于等于300)时,不显示,设置这个选项为一人非零值。默认行为是返回一个正常页,忽略代码。
CURLOPT_UPLOAD 如果你想让PHP为上传做准备,设置这个选项为一个非零值。
CURLOPT_POST 如果你想PHP去做一个正规的HTTP POST,设置这个选项为一个非零值。这个POST是普通的 application/x-www-from-urlencoded 类型,多数被HTML表单使用。
CURLOPT_FTPLISTONLY 设置这个选项为非零值,PHP将列出FTP的目录名列表。
CURLOPT_FTPAPPEND 设置这个选项为一个非零值,PHP将应用远程文件代替覆盖它。
CURLOPT_NETRC 设置这个选项为一个非零值,PHP将在你的 ~./netrc 文件中查找你要建立连接的远程站点的用户名及密码。
CURLOPT_FOLLOWLOCATION 设置这个选项为一个非零值(象 “Location: “)的头,服务器会把它当做HTTP头的一部分发送(注意这是递归的,PHP将发送形如 “Location: “的头)。
CURLOPT_PUT 设置这个选项为一个非零值去用HTTP上传一个文件。要上传这个文件必须设置CURLOPT_INFILE和CURLOPT_INFILESIZE选项.
CURLOPT_MUTE 设置这个选项为一个非零值,PHP对于CURL函数将完全沉默。
CURLOPT_TIMEOUT 设置一个长整形数,作为最大延续多少秒。
CURLOPT_LOW_SPEED_LIMIT 设置一个长整形数,控制传送多少字节。
CURLOPT_LOW_SPEED_TIME 设置一个长整形数,控制多少秒传送CURLOPT_LOW_SPEED_LIMIT规定的字节数。
CURLOPT_RESUME_FROM 传递一个包含字节偏移地址的长整形参数,(你想转移到的开始表单)。
CURLOPT_SSLVERSION 传递一个包含SSL版本的长参数。默认PHP将被它自己努力的确定,在更多的安全中你必须手工设置。
CURLOPT_TIMECONDITION 传递一个长参数,指定怎么处理CURLOPT_TIMEVALUE参数。你可以设置这个参数为TIMECOND_IFMODSINCE 或 TIMECOND_ISUNMODSINCE。这仅用于HTTP。
CURLOPT_TIMEVALUE 传递一个从1970-1-1开始到现在的秒数。这个时间将被CURLOPT_TIMEVALUE选项作为指定值使用,或被默认TIMECOND_IFMODSINCE使用。
CURLOPT_URL 这是你想用PHP取回的URL地址。你也可以在用curl_init()函数初始化时设置这个选项。
CURLOPT_USERPWD 传递一个形如[username]:[password]风格的字符串,作用PHP去连接。
CURLOPT_PROXYUSERPWD 传递一个形如[username]:[password] 格式的字符串去连接HTTP代理。
CURLOPT_RANGE 传递一个你想指定的范围。它应该是”X-Y”格式,X或Y是被除外的。HTTP传送同样支持几个间隔,用逗句来分隔(X-Y,N-M)。
CURLOPT_POSTFIELDS 传递一个作为HTTP “POST”操作的所有数据的字符串。
CURLOPT_REFERER 在HTTP请求中包含一个”referer”头的字符串。
CURLOPT_USERAGENT 在HTTP请求中包含一个”user-agent”头的字符串。
CURLOPT_FTPPORT 传递一个包含被ftp “POST”指令使用的IP地址。这个POST指令告诉远程服务器去连接我们指定的IP地址。这个字符串可以是一个IP地址,一个主机名,一个网络界面名(在UNIX下),或是‘-'(使用系统默认IP地址)。
CURLOPT_COOKIE 传递一个包含HTTP cookie的头连接。
CURLOPT_SSLCERT 传递一个包含PEM格式证书的字符串。
CURLOPT_SSLCERTPASSWD 传递一个包含使用CURLOPT_SSLCERT证书必需的密码。
CURLOPT_COOKIEFILE 传递一个包含cookie数据的文件的名字的字符串。这个cookie文件可以是Netscape格式,或是堆存在文件中的HTTP风格的头。
CURLOPT_CUSTOMREQUEST 当进行HTTP请求时,传递一个字符被GET或HEAD使用。为进行DELETE或其它操作是有益的,更Pass a string to be used instead of GET or HEAD when doing an HTTP request. This is useful for doing or another, more obscure, HTTP request. 注意: 在确认你的服务器支持命令先不要去这样做。下列的选项要求一个文件描述(通过使用fopen()函数获得)
CURLOPT_FILE 这个文件将是你放置传送的输出文件,默认是STDOUT.
CURLOPT_INFILE 这个文件是你传送过来的输入文件。
CURLOPT_WRITEHEADER 这个文件写有你输出的头部分。
CURLOPT_STDERR 这个文件写有错误而不是stderr。用来获取需要登录的页面的例子,当前做法是每次或许都登录一次,有需要的人再做改进了
CURLOPT_AUTOREFERER 自动设置header中的referer信息
CURLOPT_BINARYTRANSFER 在启用CURLOPT_RETURNTRANSFER时候将获取数据返回
CURLOPT_COOKIESESSION 启用时curl会仅仅传递一个session cookie,忽略其他的cookie,默认状况下curl会将所有的cookie返回给服务端。session cookie是指那些用来判断服务器端的session是否有效而存在的cookie。
CURLOPT_CRLF 启用时将Unix的换行符转换成回车换行符。
CURLOPT_DNS_USE_GLOBAL_CACHE 启用时会启用一个全局的DNS缓存,此项为线程安全的,并且默认为true。
CURLOPT_FAILONERROR 显示HTTP状态码,默认行为是忽略编号小于等于400的HTTP信息
CURLOPT_FILETIME 启用时会尝试修改远程文档中的信息。结果信息会通过curl_getinfo()函数的CURLINFO_FILETIME选项返回。
CURLOPT_FOLLOWLOCATION 启用时会将服务器服务器返回的“Location:”放在header中递归的返回给服务器,使用CURLOPT_MAXREDIRS可以限定递归返回的数量。
CURLOPT_FORBID_REUSE 在完成交互以后强迫断开连接,不能重用。
CURLOPT_FRESH_CONNECT 强制获取一个新的连接,替代缓存中的连接。
CURLOPT_HTTPGET 启用时会设置HTTP的method为GET,因为GET是默认是,所以只在被修改的情况下使用。
CURLOPT_HTTPPROXYTUNNEL 启用时会通过HTTP代理来传输。
CURLOPT_MUTE 将curl函数中所有修改过的参数恢复默认值。
CURLOPT_RETURNTRANSFER 将curl_exec()获取的信息以文件流的形式返回,而不是直接输出。
curl_getinfo()函数的作用是获取一个curl连接资源句柄的信息,curl_getinfo()函数有两个参数,第一个参数是curl的资源句柄,第二个参数是下面一些常量:

curl_getinfo()参数
名称 说明
CURLINFO_EFFECTIVE_URL 最后一个有效的url地址
CURLINFO_HTTP_CODE 最后一个收到的HTTP代码
CURLINFO_FILETIME 远程获取文档的时间,如果无法获取,则返回值为“-1”
CURLINFO_TOTAL_TIME 最后一次传输所消耗的时间
CURLINFO_NAMELOOKUP_TIME 名称解析所消耗的时间
CURLINFO_CONNECT_TIME 建立连接所消耗的时间
CURLINFO_PRETRANSFER_TIME 从建立连接到准备传输所使用的时间
CURLINFO_STARTTRANSFER_TIME 从建立连接到传输开始所使用的时间
CURLINFO_REDIRECT_TIME 在事务传输开始前重定向所使用的时间
CURLINFO_SIZE_UPLOAD 上传数据量的总值
CURLINFO_SIZE_DOWNLOAD 下载数据量的总值
CURLINFO_SPEED_DOWNLOAD 平均下载速度
CURLINFO_SPEED_UPLOAD 平均上传速度
CURLINFO_HEADER_SIZE header部分的大小
CURLINFO_HEADER_OUT 发送请求的字符串
CURLINFO_REQUEST_SIZE 在HTTP请求中有问题的请求的大小
CURLINFO_SSL_VERIFYRESULT Result of SSL certification verification requested by setting CURLOPT_SSL_VERIFYPEER
CURLINFO_CONTENT_LENGTH_DOWNLOAD 从Content-Length: field中读取的下载内容长度
CURLINFO_CONTENT_LENGTH_UPLOAD 上传内容大小的说明
CURLINFO_CONTENT_TYPE 下载内容的“Content-type”值,NULL表示服务器没有发送有效的“Content-Type: header”

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对的支持。如果你想了解更多相关内容请查看下面相关链接

加载全部内容

相关教程
猜你喜欢
用户评论