Google收购Kaggle,数据分析看Google收购历史


(kikidai) #1

Google在3月8日的 Google Cloud Next 谷歌云计算开发者大会上,宣布收购数据科学“华山论剑”网络社区Kaggle,引发界内热议。媒体评论道,“Google此次收购震动AI、机器学习、数据科学三界”。为了更好的了解Google通过收购对互联网行业的布局,我用R语言对Google的收购历史进行简单的数据分析。

分析显示,Google收购数量最高的前5名分别是:传媒与娱乐、社交平台和照片、企业合作工具、开发工具及云平台、移动端。被收购公司所在地涉及16个国家和18个美国的州。美国本土收购公司所在地前三名为加州、纽约、马萨诸塞州;海外收购公司所在地前三名为加拿大、英国、以色列。

Dataset 简单介绍

我在一个叫做Google Acquisition Tracker的网站上找到了Google的收购历史。

![](data:image/svg+xml;utf8,)

通过简单的Data Exploration,可以看到数据集中有5行内容:被收购企业名、收购日期、被收购企业所在地区、被收购企业所处行业、合作的风投公司。

![](data:image/svg+xml;utf8,)

数据清理与整理(Data pre-processing)

由于合作的风投公司这一列有太多N/A,且对我们的分析没太大的用处,所以扔掉这一列。收购日期信息中,由于详细的日期对我们的分析并无帮助,这里我提取收购年份,扔掉其他日期信息。

这是我整理后的数据集。

![](data:image/svg+xml;utf8,)

行业分布

我用unique()函数想看一下Google的投资方向,他们的投资总共涉及24个行业和领域。

![](data:image/svg+xml;utf8,)

由于谷歌并未公布很多投资金额细节,我这里用ggplot2对收购数量画了一个柱状图,来看一下在各行业的投资情况。可以看出,Google收购数量最高的前5名分别是:传媒与娱乐、社交平台和照片、企业合作工具、开发工具及云平台、移动端。

![](data:image/svg+xml;utf8,)

我随手搜了一些Google在各行业的收购及业务线整理,搜到了下图,很让人吃惊。

![](data:image/svg+xml;utf8,)

图源:my.infocaptor.com

地理分布

我用unique函数看一下Google收购的公司的所属地,他们的投资总共涉及34个国家和地区,16个国家,18个美国的州。美国本土收购中,加州公司占总数53.7%,纽约公司占7.4%,马萨诸塞州公司占4.6%。在海外收购中,加拿大公司占总数5.6%,英国公司占2.8%,以色列公司占2.3%。

![](data:image/svg+xml;utf8,)

![](data:image/svg+xml;utf8,)

在收购数据科学社区Kaggle的同时,Google宣布与数家风投合办“初创企业机器学习比赛”,并发布了用于分析视频的机器学习API,展示出Google在数据科学和人工智能领域新一轮的布局与雄心。