强烈建议你试试无所不能的chatGPT，快点击我

bs4爬虫的一点心得----坑

阅读量：6122 次

发布时间：2019-06-21

本文共 277 字，大约阅读时间需要 1 分钟。

bs4 里提取a标签里的坑啊

今天遇到了一个很坑的事情

使用bs4（全称：BeautifulSoup）提取一个网页里所有a标签里的href属性

比较坑的地方是这个网页里有的a标签里没有href属性，所以一运行循环提取a标签的href就可劲的报错，搞得人很焦灼

我尝试用控制循环的次数和字符串的替换来跳过这个坑。

你懂的

都失败了

最后

我将提取href的方式从[‘href’]改为get(‘href’)就逃过这个坑！！！！！！

这个bug！！！好坑！！！

转载于:https://www.cnblogs.com/phying/p/8832604.html

你可能感兴趣的文章

整理看到的好的文档

Linux磁盘管理和文件系统管理

MongoDB 第三周作业——用java操作MongoDB之删除数组中的元素

三、基于802.1x+AD+NPS+DHCP动态下发VLAN配置（第3篇、添加角色NPS并设置）

Windows开启SNMP服务----Win7

体重档案应用客户端源码

在linux中添加ftp用户,以及修改FTP默认端口号

N26-第一周作业

4月11日中高项作业

华为交换机AAA特性与思科ACS对接

TortoiseSVN客户端重新设置用户名和密码

nagios邮件报警配置

Java 生产条形码代码

python web开发-flask连接sqlite数据库

Zxing二维码扫描

计算机网络（2）

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2025-01-05 13:34:56 当前IP: 18.217.14.208 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我