卓越飞翔博客卓越飞翔博客

卓越飞翔 - 您值得收藏的技术分享站
技术文章1829本站已运行4109

php 利用cookie登录豆瓣采集内容

因为一个视频网站需要采集豆瓣内容,但是豆瓣比较恶行,不是全部内容都是可以采集的,一些视频内容需要登录会员才能看到内容,所以就有了今天的内容?
function Curl_get($url,$data = null){
    $user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.133 Safari/537.36';
    $curl = curl_init();
    curl_setopt($curl, CURLOPT_COOKIE, '{这里您自己的cookie}');//Cookie值
    //curl_setopt($curl, CURLOPT_COOKIEFILE, $cookie);//Cookie值
    curl_setopt($curl,CURLOPT_RETURNTRANSFER,1);
    curl_setopt($curl,CURLOPT_CONNECTTIMEOUT,30);
    curl_setopt($curl, CURLOPT_URL, $url);
    curl_setopt($curl, CURLOPT_USERAGENT, $user_agent);
    curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, FALSE);
    curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, FALSE);
    if (!empty($data)){
        curl_setopt($curl, CURLOPT_POST, 1);
        curl_setopt($curl, CURLOPT_POSTFIELDS, $data);
    }
    curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($curl, CURLOPT_REFERER, $ref);
    $output = curl_exec($curl);
    curl_close($curl);
    return $output;
}
这样就可以采集豆瓣内容了!
卓越飞翔博客
上一篇: 帝国CMS记录信息发布人(前台投稿)的ip地址和端口号
下一篇: 帝国CMS模板使用灵动标签和万能标签附加sql语句的写法

相关推荐

留言与评论(共有 0 条评论)
   
验证码:
隐藏边栏