“家人们,要爬虫——现在用一个电子表格就行了。”
最近看了个文章,谷歌的一款产品,直接用一个excel就可以干掉requests获取数据+存入表格的爬虫过程了,这让我学了那么久爬虫的我瑟瑟发抖。于是我就来试试这个传说中的产品。
具体产品:Google Sheet,谷歌的“Excel”
文章参考:
详细的做法,这里就不展示了,可以看上面的文章,我觉得它写的已经挺全的了。我分享一下使用的感受:
说明这个其实已经实现了网络代理,至少保证了获取的稳定和防止数据量太大封IP的问题。
- 缺点:
如果网站需要登录或者验证问题,这个方法是没法绕过的,还是需要登录才能完成。
在使用的过程中, 我觉得用的还是挺顺的。这个好东西适用于公开化的数据爬取,其他的问题暂时没有发现,待后期补充!
说明文档:https://nodatanobusiness.com/resources/importfromweb-about/