Python如何爬取首都医科大学文章-快上网网站建设公司

Python如何爬取首都医科大学文章

这篇文章主要讲解了“Python如何爬取首都医科大学文章”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“Python如何爬取首都医科大学文章”吧！

公司主营业务：做网站、网站建设、移动网站开发等业务。帮助企业客户真正实现互联网宣传，提高企业的竞争能力。创新互联建站是一支青春激扬、勤奋敬业、活力青春激扬、勤奋敬业、活力澎湃、和谐高效的团队。公司秉承以“开放、自由、严谨、自律”为核心的企业文化，感谢他们对我们的高要求，感谢他们从不同领域给我们带来的挑战，让我们激情的团队有机会用头脑与智慧不断的给客户带来惊喜。创新互联建站推出五大连池免费做网站回馈大家。

概述

爬虫项目实践
目标：首都医科大学官网新发文章

步骤

请求网址
通过正则表达式提取数据
分析数据

代码

# 导入模块
# 用于请求网址
import requests
# 用于解析网页源代码
from bs4 import BeautifulSoup
# 用于正则
import re

# 目标网址
# 设置页数,提取10页的数据
page=['']
for i in range(1,10,1):
    page.append(i)
# 保存文件
with open(r'ccmu.csv','a',encoding='utf-8') as f:
    for i in page:
        url= 'http://www.ccmu.edu.cn/zxkylw_12912/index'+str(i)+'.htm'
        # 必要时添加header请求头，防止反爬拦截
        headers={
            'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:79.0) Gecko/20100101 Firefox/79.0'
        }
        # 目标网址请求方式为get
        resp=requests.get(url)
        html = resp.content.decode('utf-8')
        # 解析html
        soup = BeautifulSoup(html,'html.parser')

        # 找到最近发表的sci论文
        # 使用find和find_all 函数
        infos=soup.find('ul',{'class':'list03'}).find_all('li')
        for info in infos:
            time=info.find('span').get_text()
            ajt= info.find('a').get_text()
            # 写入文件
            f.write("{},{}\n".format(time,ajt))

感谢各位的阅读，以上就是“Python如何爬取首都医科大学文章”的内容了，经过本文的学习后，相信大家对Python如何爬取首都医科大学文章这一问题有了更深刻的体会，具体使用情况还需要大家实践验证。这里是创新互联，小编将为大家推送更多相关知识点的文章，欢迎关注！

网站栏目：Python如何爬取首都医科大学文章
文章转载：http://www.cdkjz.cn/article/jojphj.html

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

Python如何爬取首都医科大学文章

概述

步骤

代码

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

Python如何爬取首都医科大学文章

概述

步骤

代码

相关资讯

SAP系统状态cNf的简单介绍

go语言软件 go语言软件怎么打开

腾讯云服务器报停 腾讯云服务器自动断开

高并发数据溢出php 高并发数据处理

tplink路由器改密码 tplink路由器设置密码

php汉字存入数据库 php写入数据库中文乱码

c语言函数调用参数返回值 c语言回调函数 参数传递

c语言中除法函数 c语言除法函数是什么

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

腾讯云服务器报停腾讯云服务器自动断开

c语言函数调用参数返回值 c语言回调函数参数传递

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接