博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
bs4爬虫的一点心得----坑
阅读量:6122 次
发布时间:2019-06-21

本文共 277 字,大约阅读时间需要 1 分钟。

bs4 里提取a标签里的坑啊

今天遇到了一个很坑的事情

使用bs4(全称:BeautifulSoup)提取一个网页里所有a标签里的href属性

比较坑的地方是这个网页里有的a标签里没有href属性,所以一运行循环提取a标签的href就可劲的报错,搞得人很焦灼

我尝试用控制循环的次数和字符串的替换来跳过这个坑。

你懂的

都失败了

最后

我将提取href的方式从[‘href’]改为get(‘href’)就逃过这个坑!!!!!!

这个bug!!!好坑!!!

转载于:https://www.cnblogs.com/phying/p/8832604.html

你可能感兴趣的文章
整理看到的好的文档
查看>>
Linux磁盘管理和文件系统管理
查看>>
从一个
查看>>
MongoDB 第三周作业——用java操作MongoDB之删除数组中的元素
查看>>
三、基于802.1x+AD+NPS+DHCP动态下发VLAN配置 (第3篇、添加角色NPS并设置)
查看>>
Windows开启SNMP服务----Win7
查看>>
体重档案应用客户端源码
查看>>
在linux中添加ftp用户,以及修改FTP默认端口号
查看>>
N26-第一周作业
查看>>
4月11日中高项作业
查看>>
华为交换机AAA特性与思科ACS对接
查看>>
二:Unit 8
查看>>
TortoiseSVN客户端重新设置用户名和密码
查看>>
nagios邮件报警配置
查看>>
Java 生产条形码代码
查看>>
python web开发-flask连接sqlite数据库
查看>>
Zxing二维码扫描
查看>>
MMU的作用
查看>>
决心书
查看>>
计算机网络(2)
查看>>