有认识我的朋友可能知道我过去一两年内采集了很多数据,包括不限于招聘、人口信息、气象信息、彩票开奖信息、企业工商信息等等方向,我一直在思考能用这些数据做点什么有意义的事情。最近我决定把这些数据通过可视化的方式展现出来。...
定向采集定向采集,指我们已经有了明确的采集目标与采集规则,比如我们要采集一个新闻站点,那么首先取得新闻列表中全部详情页面的链接地址,再通过链接请求详情页面的内容,这就是一个标准的定向采集爬虫。...
送走亥猪,喜迎子鼠。十二年又是一个轮回,在新的一年里,祝大家万事如意、心想事成!总结我的2019年。...
技术基础 本章主要讲解爬虫需要用到的 Java 常识和一些类库等,方面初学者或者使用其他语言的同学快速上手,如果您本身会使用 Java 编程语言,那么本章可以略过不看。...
媳妇总是问我,你一天没事就抱着手机看,乐此不疲,都在看什么?为此,我特总结一下我常看的一些公众号,都是我认为内容很有价值的,给大家分享一下。没有把我微信关注的账号全列出来,先整理了第一批,大家如果感兴趣可以留言,我会继续整理。...
爬虫概述 本章简要介绍爬虫的用途和规则。...
最近食品价格飞涨,猪肉越来越吃不起了。特此做一个微信小程序监控食品价格,供大家买菜参考……程序一共提供了两个界面。首页首页提供四大类:肉蛋鱼、蔬菜瓜果、米面油和其他种类食品的最新价格并展示位柱状图方便对比。点击某一个食品名称可以进入详情页面。详情页详情页面提供该食品的详细价格等信息。...
文章的受众是对Java编程有一定基础的开发者、希望了解网络爬虫原理并在Java中实现的读者。文章会介绍网络爬虫的基本原理、Java中实现网络爬虫的方法、避免被反爬虫机制识别等相关技术。...
之前在2015年的时候,从b3log切到了wordpress。现在,又从wordpress改回了b3-solo。wordpress越来越卡,而b3log我一直在关注,目前的solo版本非常好用,我又切回了solo。这是不是一个轮回~?...
现代社会是一个信息时代,是一个知识爆炸的时代,我们要如何从知识浩瀚的海洋中找到我们所需要的内容?我们要如何梳理我们的知识从而形成自己的知识体系?我们要如何以自己的知识体系指导我们的生活、工作?请带着以上问题阅读本文,相信您会有不小收获。...