网站建设 >

查看其它板块

python批量爬取xml文件

1.网站链接：https://www.cnvd.org.cn/shareData/list

十多年的萧县网站建设经验，针对设计、前端、开发、售后、文案、推广等六对一服务，响应快，48小时及时工作处理。成都全网营销推广的优势是能够根据用户设备显示端的尺寸不同，自动调整萧县建站的显示方式，使网站能够适用不同显示终端，在浏览器中调整网站的宽度，无论在任何一种浏览器上浏览网站，都能展现优雅布局与设计，从而大程度地提升浏览体验。成都创新互联公司从事“萧县网站设计”,“萧县网站推广”以来，每个客户项目都认真落实执行。

2.需要下载的页面文件：
python批量爬取xml文件

3.该页面需要登陆，然后批量下载共享漏洞文件，我们就通过cookie来实现。

#!/usr/bin/env python
# -*- coding: utf-8 -*-

"""
Date: 2019-08-17
Author: Bob
Description: python爬取xml文件
"""

import requests
from bs4 import BeautifulSoup

def cnvd_spider():
    url = 'https://www.cnvd.org.cn/shareData/list?max=240&offset=0'

    headers = {
        "Cookie": "__jsluid_s=65d5e7902f04498e89b16e93fb010b3c; __jsluid_h=1ab428e655aee36ac3c9835db29b6714; JSESSIONID=91BB91B37543D365AA64895EDFCD828F; __jsl_clearance=1566003116.655|0|CYPFsKirGYBG12qtoOrS5Kq1rM0%3D",
        "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36",
    }

    html = requests.get(url=url, headers=headers).text
    soup = BeautifulSoup(html, 'lxml')
    links = soup.find_all('a', attrs={'title': '下载xml'})

    for link in links:
        url = 'https://www.cnvd.org.cn' + link.get('href')
        file_name = link.get_text()
        html_data = requests.get(url=url, headers=headers)
        with open(file_name, 'w') as f:
            f.write(html_data.content)

if __name__ == '__main__':
    cnvd_spider()

当前标题：python批量爬取xml文件
当前URL：http://www.cdkjz.cn/article/jejgdh.html

返回首页了解更多建站资讯

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

大客户专线成都：13518219792 座机：028-86922220

在线咨询提交需求

友情链接交换友情链接

广汉网站建设四川门窗重庆电商网站建设简阳机房托管成都网站设计网络口碑营销中国电信成都枢纽中心成都做网站防护网厂成都移动托管

成都网站建设公司地址：成都市青羊区太升南路288号锦天国际A座10层建设咨询028-86922220

专家团队为您提供成都网站建设,成都网站设计,成都品牌网站设计,成都营销型网站制作等服务,成都建网站就找快上网！ | 成都网站建设哪家好？ | 网站建设地图

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

python批量爬取xml文件

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

python批量爬取xml文件

相关资讯

vue.js获取dom的方法-创新互联

如何使用Python实现计算器功能-创新互联

java中反射机制的作用有哪些-创新互联

JAVA如何像SQL一样对List对象集合进行排序-创新互联

使用linux的MAKEDEV命令建立设备-创新互联

OpenGL_16_镜面反射-创新互联

ubuntu10.04apt安装apache2php-创新互联

Php连接、读取和写入mysql数据库的操作-创新互联

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接