OSC 大咖说 | 专访 PingCAP 联合创始人、CTO 黄东旭:写代码、玩开源,体会造物的成就感

花仲马 发布于 2016/06/02 10:18
阅读 9K+
收藏 23

他也许是被代码之神祝福过的另类人物,出生就自带开挂体质:小学三年级开始写代码,四、五年级开始学 C 语言,到高中时就开始用 Linux …… 小小年纪就对许多开源技术熟稔于心,将开源精神推崇备至。

他直言自己是个爱好广泛的人,组乐队,玩摇滚,只要有空就会参加许多技术沙龙和分享,并会在知乎上解决很多网友的技术问题,还保持着每年去一个没去过的国家自驾游的习惯。

他叫黄东旭,PingCAP 联合创始人、CTO,是很多人仰望的国内分布式存储领域(NewSQL) 技术大神级别的人物。五月初在接受小编采访时,黄东旭显得很谦虚:我不觉得自己是什么「天才」,就是从小接触,太热爱这些东西了。

 

写代码,享受造物的成就感

Q: 之前有听说您三年级的时候就开始写代码了,一般情况下一个三年级的小朋友还在忙着写家庭作业或者看动画、玩游戏呢,您是如何接触编码这件事的呢?

A: 我小时候爱玩游戏,爸妈特别忙,但又不想让我玩游戏上瘾,我爸就把我家游戏机里所有的游戏卡都收起来,只留 Basic 的卡带,于是我打算自己写游戏,觉得很有意思。当时写程序时 Windows 还没有很普及,自己从学习机的 QBasic 写起,后来研究过 DOS 汇编,小学四、五年级开始学 C,到高中时开始用 Linux,后来就钟情于开源和自由软件运动,在这过程中自己对于开源精神和开源世界推崇的东西就都很熟悉了。

Q: 您小学初中就学完了许多大学的计算机专业课程,那个时候会有人评价您少年天才神童什么的吗?

A:我倒不觉得自己是什么「天才」,就是从小接触,太热爱这些东西了。在国内我算比较早接触开源和写代码的这批人,我年龄虽然不大,但雷军在混 BBS 写 WPS 时我也在(笑)。我觉得编码给我一种感受,就是从零开始构建你想象中的东西,当你有能力搞定时,这感觉很好,我很享受造物的成就感。

Q: 那可以和我们简要介绍一下您后来的工作经历或者项目经历吗?

A: 大学读的软件工程专业,大三时去了微软亚洲研究院工作了一年,毕业后去了网易有道做有道词典,主要负责 Windows 端、Mac 端以及部分服务器端,经历了产品从无到有的整个过程。后来到了豌豆荚,由于对豌豆荚的文化我很欣赏,且我认为豌豆荚是一个非常硅谷范儿的公司,所以就加入了当时还很小的豌豆荚。

我本身很喜欢 OpenSource 的文化和 Hacker 精神, 在豌豆荚又认识了有共同爱好的刘奇,所以我们的团队基本上做的所有东西都是开源的。

后来和他做的 Codis,国内很多公司都受益于这个项目,自己也很自豪,终于能为社区做出一点的贡献。当时 Codis 解决了很多公司的分布式缓存问题,这个项目在互联网公司使用很广泛,缓存的问题基本解决了,但是在底层关系型数据库扩展问题上还没有什么优雅的解决方案,我和刘奇就看了很多 Paper 做了很多功课,Google 在 1213 年发了两篇论文 Spanner F1,我们认为未来数据库就应该是这个样子,萌生了做这套东西的想法。不过当时公司的业务重点不在这个领域,所以我们就出来单干了。

关于创业:有真正核心技术的公司是一定会发光的

Q:公司是非常具有代表性的技术为核心的创业团队,包括咱们的创始人都是技术大牛,如何实现在资本市场上也得到了比较顺利的开展呢?

A:融资的这个事情说起来也比较传奇,我们周五决定创业,第二个周的周二我们就拿到了经纬天使轮投资,我们下午5点见的经纬,一拍即合,晚上8点就签了。

当时我们是三个人的原始团队,三个技术人员的创业被问到商业方面问题还比较头疼,但是我觉得让一个程序员学商业的东西,比教 Sales 写程序还是要简单不少(笑)。而且OpenSource Business Model(开源的商业模式)在硅谷也是很成熟的商业模式 ,在美国像 Clouder,  Docker, CoreOS 甚至 OpenStack 基金会等这些依托于开源项目的成功的公司也有很多,其商业模式是得到过验证的。

我感觉这两年,尤其是最近无论是从投资人和社会大环境来看,是金子就会发光,拥有真正核心技术的公司是不会被埋没的,如果你的技术很好或者市场契合度高,还是会得到很多资本的认可的。 

Q:您觉得贵公司的产品在业内的地位和竞争情况如何呢?

A: 因为做的东西比较前沿,粗略估计的话,我觉得国内开源的项目里目前还没有直接的竞争者,闭源的阿里的 Oceanbase 可以勉强算,但不算直接的竞争对手。

在国外我们有些惺惺相惜的友商,比如 CockroachDB(蟑螂数据库)。虽然我们的兼容性不同,我们是 MySQL 协议兼容,他们是 PostgreSQL,但是我们都想做水平扩展的分布式关系型数据库,都认为 SQL 一定是未来数据存储的终极目标。这个事情在 Google 内部已验证成功,Spanner Google 内部已经要一统江湖了,Google 很多数据的存储都已经往这上迁了。

此外,Hadoop 是谷歌 MapReduce/GFS 方案的开源实现,我们做的事情有点像当年写 Hadoop,现在看看 Hadoop 现在有万亿级别的市场;我相信经过几年 NewSQL 的市场不会比 Hadoop 小。到那时我们是走在最前面积累最深的团队。

Q:  您现在自己创业了,团队构成情况如何?您又是如何选择团队成员的呢?

A: 我们团队现在有 20人,聚集了领域内顶尖的人员,大部分还是分布式系统和存储工程师,开发模式完全是自主研发,我们去年 6 月份从零开始写出第一行代码,到现在为止 TiKV TiDB 已经进入 Alpha,近几个月就会发布 Beta 版本。

我们做的事情对于底层架构的开发者来说很有吸引力,因为这个东西一直没人尝试,如果做出来,那是有可能会在整个计算机历史上留下一些痕迹的。所以早期很多我们的小伙伴不为别的,就为这个理想。

现在团队中很多人是通过朋友介绍或社区上面找到的,我本身很认可社区里的人,因为大家一起协同开发,在社区里有一定的工作配合;现在招聘我们也尽量让候选人在社区里与大家协作一小段时间,这是一种很好的招聘方式。

在选人标准上,因为我们做的东西很新也比较难,所以不仅要考察应聘者的专业能力,还要注意到他对于难题的 Passion 和学习能力;早期我和刘奇基本上把相关领域,能找到的所有资料已经消化了很久很久。我相信大家在一起,没有什么解决不了的问题。

Q: 还有哪些细分领域的技术创业您比较看好?

A:我个人观点是技术软件方面,我坚定的认为未来一切都会运行在云上,公有也好私有也罢,云背后带来的思想是隐藏物理的计算资源,让开发者只需要关心业务本身。现在还没有被挖掘出的是比如像容器之上的调度器,调度器方面能做的事情很多。现在大家纷纷去做 Docker,但真正在云方面,容器只是一部分,如何将容器调度器与容器相融合,做到真正可扩展的应用架构的公司了并不多,这块还是很有机会的。

做个钟情开源的技术极客

Q: 您何时开始涉足大数据?为什么会选它进行钻研?

A: 因为个人兴趣所在,我涉猎比较广泛,但直到在豌豆荚从事 Infrastructure,才开始全职做有关底层架构方面。

我认为,存储是业务的核心,所有的业务最后依赖的是存储,关系型数据库则是存储里最难的。我们在搭建豌豆荚整个存储架构时,关系型数据库不能满足水平扩展和伸缩,无法提供真正的优雅的方案,开源、闭源的都没有,所以我们觉得整个技术栈上,业务层面可通过容器和调度器做水平扩展,缓存层面可通过 CodisRedis Cluster 等进行水平拓展,非结构化数据存储系统可通过 Hadoop 或者各种 NoSQL 方案水平扩展,唯独最核心的关系型数据库没有任何方法。

后来,发现解决这个问题真的特别困难,有段时间我们认为这个的复杂度比我们想象的要大的多甚至有点沮丧。不过还好,我们的早期团队很给力,如今已经度过最难的阶段,TiDB TiKV 的核心已经初步稳定,一切都在往好的方向发展。

Q: 作为技术极客,您认为国内现在整体编程水平和国外相比是一个什么程度?

A:国内一线互联网公司,比如 BAT、华为、京东等里面有一些非常厉害的技术人员,顶级开发者的水平不比国外差,我在硅谷其实也是这种感受,这几年随着移动互联网和社会的发展,中国无论是网站、APP,这些对于基础设施承受的流量,比硅谷很多公司都要大很多,所以国内很多平台工程师的经历让他们进步很快,比如百度、阿里的工程师见过的一些场景和面对的压力,会比硅谷的一些公司要大的多,所以国内顶级基础架构工程师技术层面的水平是不会比硅谷差。

但是开源的文化氛围还没跟上,就比如国内大家很少在社区中一起协作一些东西。我认为造成这样问题的原因有两点:一是国内工程师太忙,压力大,实在被压榨得没时间(笑);二是对于开源的理解太浅,不知道为什么要做、做什么、要如何做;另一点是语言,社区的官方语言是英文,这点是国内天然的障碍。

所以近几年,中国在世界范围内发出声音的开源项目只有 Kylin、PingCAP、Hyper.sh ,鲜有其他的案例了。但我认为未来几年会涌现出来的,原因也很简单,开发者的水平已经到那个层次了。

我们的愿景是聚集中国最顶尖的开发者,合力做一些事情,最终在世界范围内有影响力。

开源不仅仅是写代码,还有文档、社区讨论、推广项目,代码只是很小的一部分,要补的东西很多,但方向是正确的。

Q:您如此钟爱开源,那平时您都会使用哪些开源社区?

A:主要是 GitHub,我们公司所有的代码托管、协作等都依托在 GitHub 上,当然一些我们自己的项目也会放在 OSC 上,很方便;放在 GitHub 因为要和全球沟通,GitHub 是程序员界通用的平台。 

Q:您认为 Git@OSC (码云) GitHub 的区别?

A: 我觉得从产品、技术本身没太大的区别,在国内 OSC 的速度要比 GitHub 快很多,但是 GitHub 的环境很好,有非常多的使用者,使用者的平均水平也比较高,目前中国做社区的土壤并不是很好,海外知道 OSC 的人不多。我也常使用 OSC,但我觉得咱们应该聚集更多大牛持续关注和贡献,放在首页推荐的内容质量要高,我们的数量已经很高了,但是质量有待提高。

寄语众包

A: 我觉得众包这件事很好,曾经我很想接私活儿(欢迎欢迎,撒花欢迎~),苦于没有平台,所以希望有这样的平台挣点外快。不过有一点难落地的原因是:在线上做协作,对合作的人的要求很高,比如一个很强一个很弱,你几天已经完成项目而对方做了半个月还没完成,就不太好控制,需要很强的架构师去做统筹。我最早接触类似的平台是 Topcoder,它将众包变成类似编程比赛的形式,类似悬赏的模式,只有前 2 名有奖金,带来的不仅是钱,还有荣誉感。对于大学生是一个很好的锻炼平台。

Q:您认为未来软件开发模式,众包会有很大占有率吗?

A:我认为软件开发很复杂,有很多方式:开源、众包、IBM 等大公司里的大教堂等方式,他们各有擅长的方面、领域,这种适合的软件领域都是不重叠的;非核心的技术比如 APP、普通的通用软件可以选择众包。一些专有、大型软件还是需要正统的软件工程体系构建出来。各种方式都会有各自的市场。

后记:

强压迷妹本性和要签名的欲望,小编结束了对黄东旭的采访,而且邀请黄东旭在 OSC 上进行进一步的技术分享,和本土的 OSCer 有更多的交流(小编真的毫无私心,一心为了大家啊)!未来,黄东旭和 PingCAP 将在 OSC 从数据库技术知识、案例经验、开源项目研究等更多层面做进一步的分享和交流,敬请期待哦!

加载中
1
4fun
4fun
[3] 3年纪就撸代码?我三年级还在玩魔塔。话说这家伙还有头发
0
开源中国首席男司机
开源中国首席男司机
我去 很久前就关注TIDB 原来是这大神搞的啊
0
g
gaopan999
大神是这样炼成的
0
chenwenli
chenwenli
愿景很好,希望共同努力
0
郑凯努
郑凯努
第一眼看成黄旭东。。
0
mia0x75
mia0x75
干死黄旭东。
0
土卫十六
土卫十六
PingCAP到底是什么嘛,也不介绍一下!
0
SageHeaven
SageHeaven
确实很厉害
0
funwun
funwun
算是个高手
返回顶部
顶部