又是一年,GitHub 例行发布了 2017 年度的章鱼猫观察报告。以下我们撷取此报告中一些有趣的结果分享给大家。

数百万的开发人员使用 GitHub 来共享代码和构建业务。在这里你可以完成你的工作、打造新的技术、贡献给开源项目等等。历史已经证明,当好奇的人聚集到一起工作,一些美好的事情就会随之而来:工作进行得更快、新的想法涌现,从根本上改变了我们建立软件的方式。

为了庆祝这贡献和辉煌的一年, 让我们回顾一下 2017 年的项目、人员和团队。

十年千万,遍及全球

过去这十年,GitHub 各项数据已经超过了百万级,甚至千万级。在 2017 年,GitHub 社区有 2400 万开发者工作于 6700 万个仓库上,就连这些开发者组成的组织都达到了 150 万个。

而这些开发者遍及全球:亚洲 710 万,北美 590 万,欧洲 530 万,等等。

这一年,忙碌的一年

人们在 2500 万个公开仓库上分享代码。从 2016 年 9 月到现在的一年间:

  • 公开仓库的提交数达到了 1 亿个
  • 活跃仓库有 2530 万个(“活跃”指该仓库有公开的活动,比如提交、星标、讨论等)
  • 活跃 工单 issue 有 1250 万个,关闭(解决)了 6880 万个工单,对工单进行了 140 万次讨论
  • 新 PR ( 拉取请求 pull request )有 130 万个,
  • 第 1 亿个 PR 被合并,这是一个 OpenShift 的文档更新
  • 对代码进行了 62 万次审查
  • 最流行的表情符是:点赞(720 万)
  • 新加入 670 万开发者,其有 100 万的开发者来自美国,69 万来自中国
    • 这些新加入的开发者发起了 120 万个 PR,410 万人创建了其第一个仓库,
    • 19 万人没有提交任何代码而只是复刻和星标了仓库
  • 创建了 45 万个组织
    • 这其中包括 Python 的开发也迁移到了 GitHub

编程语言,各就其位

通过 PR 所使用的语言,可以发现最流行的语言是——JavaScript!而 Python 取代了 Java 成为了第二名。很高兴 Ruby 和 PHP 分别能取得第四、第五名。其余的名次和去年相差不大。

项目排名,众望所归

从这些活跃的仓库中,我们找出了 10 大 复刻 fork 数最多的仓库。人工智能方向的 TensorFlow 项目夺得桂冠,前端方向的 BootStrap 是第二。尤雨溪的 vuejs 排名第六,恰恰比排名第七的 Facebook 的 react 的复刻数高一点,很难说这与今年 Facebook 对 react 的许可证问题有没有关系。而 Linus 的 Linux 项目敬陪末座,作为这样庞大的一个项目,已经相当了不起了。

(这里没有包括 MOOC 课程,一个 Coursera 的 R 语言课程有数千的复刻数,以此判断,至少有十万学生开始学习该课程了)

而以贡献者来说,微软的 vscode 项目的贡献者最多,几乎是排在第二名的 react-native 的两倍。这一方面证明了社区对 vscode 的喜爱,另外一方面也证明了微软在开源方面的重注投入。

得到最多代码评议的项目是 Typescript 的一个类型定义库 DefinitelyTyped,第二名才是炙手可热的 Kubernetes

当然,已经赢得了容器编排系统之战的 Kerbernetes 取得讨论最多的排名一点也不令人意外,它的讨论数量的零头就和第二名 origin 差不多,而这个 OpenShift 下的 Origin 项目,也是一个 Kubernetes 项目——面向开发者的企业版 Kubernetes 发行版。

企业版,大公司多用

GitHub 虽然对个人的公开使用提供免费的服务,当然,如果你想放私有仓库,是要交费的。而 GitHub 对于或大或小的企业来说,更适用的是其企业版。

  • 美国前一百个最大的公司(按收入)有一半在使用 GitHub 企业版
  • 虽然美国是使用 GitHub 企业版最多的国家,但是也有 1/4 的客户来自其它国家
  • 不仅仅是软件和互联网行业在使用 GitHub 企业版(占 22%),金融服务、商业服务也占比较高

感谢你,让我们期待 2018 年的章鱼猫报告!

⤧  Next post 如何分析博客中最流行的编程语言 ⤧  Previous post 明确 GPL 版本号,避免许可证混淆