如何写爬虫程序爬取豆瓣网或者新浪微博里的内容
根据你学的语言的api获取豆瓣网的html源码,然后用正则匹配出想匹配的东西。
如何写爬虫程序爬取豆瓣网或者新浪微博里的内容
建议可以使用前嗅的ForeSpider数据采集软件可以采集,我之前就采过豆瓣的影评,可以设置各种过滤规律,比如我只要豆瓣评分6.0以上的电影,就可以精确的过滤。
新浪微博的内容也是可以采到的。
推荐你先去下载一个免费版的试试,没有功能和使用时长限制。
希望对你的问题有帮助
根据你学的语言的api获取豆瓣网的html源码,然后用正则匹配出想匹配的东西。
建议可以使用前嗅的ForeSpider数据采集软件可以采集,我之前就采过豆瓣的影评,可以设置各种过滤规律,比如我只要豆瓣评分6.0以上的电影,就可以精确的过滤。
新浪微博的内容也是可以采到的。
推荐你先去下载一个免费版的试试,没有功能和使用时长限制。
希望对你的问题有帮助