有些经历来用程序爬网页。

个人项目用java和php来post东西,用jmeter和selenium公司测试,
忘记用了什么程序语言来抓了某个电子书网站,只记得数据库是mongodb。

都是现学现用,没深入研究过,所以也基本没留下啥印象。

去年有个机会参加一个活动认识了下面这本书的著者
Pythonクローリング&スクレイピング -データ収集・解析のための実践開発ガイド
买了书想系统的学一下爬网站。没有具体的需求也没动力,书翻完了,例子也跑了。
没留下什么深刻的印象。

最近学机器学习相关的东西,遇到瓶颈,找本python的书来转换心情,就找到了这本英文书。
花了一周的时间,从头看到尾。挺喜欢这本书,虽然不是那么深入,但内容很广,
渐渐的串起来原来那些不太完整的爬网站的经验,而且觉得写作风格也挺风趣。

打算自己搞一个野外宿营地查询的垂直搜索网站。什么时候着手还不知道,爬信息的时候,
这本书的一些内容应该很有帮助。
开始写网站的时候,就陆续上一些读书笔记吧。

Leave a Reply

Your email address will not be published. Required fields are marked *