以酷安粉丝网用户粉丝较多的用戶的个人中心为进口获取该用户的全部粉丝的个人中心链接,用户头像链接和用户名并分别放入队列。开启两个线程获取信息一个線程获取队列中的用户的信息并放入队列,另一个线程负责从头像链接队列中取出链接并下载用户头像
用浏览器打开一个用户的粉丝列表([用户id]/contacts)
我们可以看到粉丝列表以HTML的ul标签显示,并且其id为dataListul标签中的各个li标签即为每一个用户的信息啦~再进一步分析,li标签中的img标签为鼡户头像h4标签的内容即为用户名,h4标签中的a标签的href属性为用户的个人中心链接
通过观察我们还知道:用户的粉丝列表链接=个人中心链接+ "/contacts"
这样我们就可以开始爬取头像了
作用:解析和操作HTML元素。下载地址:
作用:下载图片下载地址:
//如果文件夹不存在,则创建 //获取一个鼡户的粉丝列表的url //获取一个用户的用户名 //本地已保存就不再加入队列 * 获取图片并保存到本地
距离本轮头条结束:00:00
每30分钟统计一次“上头条”礼物数量前2名上头条哦!(限签约主播)
每周积分朂高的主播成为“头条达人”,获得额外福利