python简单爬虫程序

智能摘要

思路

爬虫之前要分析下规律，由于**之家的车型不是接口调用的，所以选择用html解析来获取数据，那么车型有4级，我只要把问题化繁为简，就类似获取一个车型下的车系，排量，年款

下一级页面跟上一级有关联，所以根据链接进入下级页面，获取数据，这样一直到第四级，这样问题解决了，就在最顶级（车型）一个循环就可以了

库

需要使用到的库有 urllib，xlwt，json，re，beautifulSoup

urllib提供http请求

注：这里遇到一个html乱码问题，只需要设置相应的字符串编码即可

            
            def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html.decode('gbk')

xlwt写入excel文档

json解析数据

beautifulSoup类jquery一样操作html文档

re正则匹配路由变量

源码下载地址：python爬去车型库

本文为原创，未经授权，禁止任何媒体或个人自媒体转载

商业侵权必究，如需授权请联系340443366@qq.com

python

加载中...

https://static.kelen.cc/images/549aebaf-f863-445b-9612-11f53c3b2fa7.jpg

其他 • 2024-09-30

🚀 免费chatgpt3.5合集，部分还支持chatpgt4，不定期更新

ChatGPT 镜像提供了海量优质内容，包括编程语言、框架、算法、数据结构、前端开发、后端开发、移动开发等各个方面的技术文章和教程，本文推荐优质的ChatGPT镜像，供大家学习使用。

https://static.kelen.cc/images/4d541789-4630-4065-b2df-83aff51720fe.png

其他 • 2024-09-21

前端页面加载性能指标之LCP

之前已经介绍过FCP，本文介绍与之相对应的LCP。通过上文得知，FCP衡量的是页面首次渲染出有意义的内容的时间点，这通常包括文本、图像、非白色画布或SVG的渲染，可以让用户感知到网页正在加载。那么LCP又是什么?

https://static.kelen.cc/images/67cde27e-b5d2-4377-99fe-a8c3530694f0.webp

其他 • 2024-09-01

前端页面加载性能指标之FCP

首次内容渲染（First Contentful Paint，简称FCP）是一个以用户角度来衡量的性能指标，它衡量的是用户在**网页加载过程中首次看到内容的时间点**。这个指标之所以重要，是因为它代表了用户在屏幕上第一次看到网页内容的时刻，从而影响用户对网页加载速度的感知。一个快速的FCP可以增强用户的体验，**让用户感知到页面正在加载内容**。

python简单爬虫程序

智能摘要

思路

库

评论

相关推荐

🚀 免费chatgpt3.5合集，部分还支持chatpgt4，不定期更新

前端页面加载性能指标之LCP

前端页面加载性能指标之FCP