网址:
http://itianti.sinaapp.com/index.php/mcpu
最近女票要买电脑,看了几款,于是我就帮她看看这几款的CPU咋样,就找了一个CPU天梯排行榜。一瞅发现,榜上有800+个CPU,一个一个找,得累死。刚好最近了解了python爬虫,于是乎,就写了一个爬虫脚本,把排名和CPU名字爬了并且保存下来了。
代码如下:
import requests #导入包
from bs4 import BeautifulSoup
res = requests.get("http://itianti.sinaapp.com/index.php/mcpu/")
res.encoding = 'utf-8' #显示中文
soup = BeautifulSoup(res.text, 'html.parser') #解析html
table = soup.select('#maintable')[0] #爬取id为'maintable'的元素
tbody = table.select('tbody')[0] #爬取tbody标签的元素
f = open("out.txt","w") #保存到文件中
f.write("排名 名称")
for i in tbody.select('tr'): #遍历tr标签
temp = i.select('td') #挑选td标签
rank = temp[0].text
name = temp[1].text
#print(rank + " " + name)
print("%s %s" %(rank, name), file = f)
保存成txt文件后,查某个CPU排行,只要ctrl+F就好啦~~~
。。。。
不过后来才知道,原来谷歌上的网页也是可以ctrl+F,进行查找的。。。。。。。。。
涨姿势了。。。
今天的文章爬虫实战–爬取CPU天梯榜单分享到此就结束了,感谢您的阅读,如果确实帮到您,您可以动动手指转发给其他人。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/30084.html