好强的谷歌“Excel”,不用自己写代码就能爬虫,网友立马cue微软:慌不慌?

2022 年 10 月 16 日 量子位
丰色 发自 凹非寺
量子位 | 公众号 QbitAI

家人们,要爬虫——现在用一个电子表格就行了。

一行代码也别写,第三方软件也甭安。

只需在表格里点几下就ok。

不信,你瞧:

就这么两下,网页上的商品信息都有了。

网友看完都惊呆了,码个不停。

一看到这是来自谷歌的产品(Google Sheet,谷歌的“Excel”),大家就立马cue起了微软,问它慌不慌。

还有人称这是在“跨界打击”它。

 扫盲:“巨硬”就是微软,网友给的调侃

好不热闹。

来看具体怎么实现。

详细步骤

以爬亚马逊某个手机产品的商品页为例。

我们先打开谷歌Sheet(网友版即可),新建一个文档。

然后copy一下要爬的网址,粘进去。

剩下的都在Sheet里完成。

我们先列一下要爬的元素,这里依次为:

商品图片-识别码(asin,亚马逊给每个商品生成的唯一标识)-商品名-价格-评分-图片网址。

然后就可以正式开始爬了。

要诀就是一个叫做ImportFromWeb的函数。

它也是个插件,没有的需要先安装一下(安装地址放文末了),然后通过Google Sheet程序的“扩展程序”菜单导入就行。

我们只需把ImportFromWeb函数放进asin那一列,然后第一个参数选中刚刚粘过来的网址,第二个参数把要爬的元素单元格拖一遍(除了“图片”)

稍等个1~2s,价格、商品名等信息就都出来了!

还差图片。

简单~基操~

用IMAGE函数把G3格子里得到的图片网址值给过去就行。

至此,第一个商品页里的东西就爬到了。

唯一麻烦的是,如果还需要爬更多商品的信息,需要把商品网址挨个粘一遍。

然后就没啥了,除了给单元格地址的行标列标加一下绝对引用符“$”。

这里可以不学视频,直接一个f4就行。

拖一下,全部搞定!

怎么样?是不是非常方便。

看完整个操作,你也发现了,其实就是谷歌写了个脚本给咱封装好了直接用。

而据官方介绍,这个ImportFromWeb功能还能自动更新爬取到的信息。

而且只要是用JS写的网站都可以爬(基本等于绝大数网站了),每个函数还可支持50个url,以及数千个数据点。

快点起来吧~

参考链接:
[1]https://weibo.com/1402400261/M9ZY84thO?filter=hot&root_comment_id=0&type=comment
[2]
https://www.getapp.sg/software/2060417/importfromweb
[3]https://workspace.google.com/marketplace/app/importfromweb_web_scraping_in_google_she/278587576794(安装ImportFromWeb)

MEET 2023 大会启动

邀你共论智能产业穿越周期之道

今年12月,MEET2023智能未来大会将再度邀请智能科技产业、科研、投资领域大咖嘉宾,共同探讨人工智能行业破局之道。

欢迎智能科技企业参会,分享突破性成果,交流时代级变革,共襄盛会!点击链接或下方图片查看大会详情:

量子位「MEET 2023智能未来大会」启动,邀你共论智能产业穿越周期之道


点这里关注我 👇 记得标星噢 ~


一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 


登录查看更多
0

相关内容

【开放书】《命令行数据科学指南(第二版)》
专知会员服务
42+阅读 · 2021年12月13日
专知会员服务
58+阅读 · 2021年1月17日
专知会员服务
90+阅读 · 2020年12月26日
【2020新书】从Excel中学习数据挖掘,223页pdf
专知会员服务
85+阅读 · 2020年6月28日
AAAI2020接受论文列表,1591篇论文目录全集
专知会员服务
98+阅读 · 2020年1月12日
Keras作者François Chollet推荐的开源图像搜索引擎项目Sis
专知会员服务
29+阅读 · 2019年10月17日
知识图谱本体结构构建论文合集
专知会员服务
102+阅读 · 2019年10月9日
看不懂代码?AI给你做翻译,说人话的那种
量子位
0+阅读 · 2022年1月30日
微软校园招聘网申手把手攻略
微软招聘
82+阅读 · 2020年8月12日
Webkiller 简单利用
黑白之道
11+阅读 · 2019年6月11日
搭建自己的searx搜索引擎
黑白之道
13+阅读 · 2019年5月31日
一文看懂怎么用 Python 做数据分析
大数据技术
23+阅读 · 2019年5月5日
一个牛逼的 Python 调试工具
机器学习算法与Python学习
15+阅读 · 2019年4月30日
用Python调用百度OCR接口实例
数据挖掘入门与实战
16+阅读 · 2018年1月29日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年11月23日
Arxiv
23+阅读 · 2017年3月9日
VIP会员
相关VIP内容
【开放书】《命令行数据科学指南(第二版)》
专知会员服务
42+阅读 · 2021年12月13日
专知会员服务
58+阅读 · 2021年1月17日
专知会员服务
90+阅读 · 2020年12月26日
【2020新书】从Excel中学习数据挖掘,223页pdf
专知会员服务
85+阅读 · 2020年6月28日
AAAI2020接受论文列表,1591篇论文目录全集
专知会员服务
98+阅读 · 2020年1月12日
Keras作者François Chollet推荐的开源图像搜索引擎项目Sis
专知会员服务
29+阅读 · 2019年10月17日
知识图谱本体结构构建论文合集
专知会员服务
102+阅读 · 2019年10月9日
相关资讯
看不懂代码?AI给你做翻译,说人话的那种
量子位
0+阅读 · 2022年1月30日
微软校园招聘网申手把手攻略
微软招聘
82+阅读 · 2020年8月12日
Webkiller 简单利用
黑白之道
11+阅读 · 2019年6月11日
搭建自己的searx搜索引擎
黑白之道
13+阅读 · 2019年5月31日
一文看懂怎么用 Python 做数据分析
大数据技术
23+阅读 · 2019年5月5日
一个牛逼的 Python 调试工具
机器学习算法与Python学习
15+阅读 · 2019年4月30日
用Python调用百度OCR接口实例
数据挖掘入门与实战
16+阅读 · 2018年1月29日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员