开源中国

我们不支持 IE 10 及以下版本浏览器

It appears you’re using an unsupported browser

为了获得更好的浏览体验,我们强烈建议您使用较新版本的 Chrome、 Firefox、 Safari 等,或者升级到最新版本的IE浏览器。 如果您使用的是 IE 11 或以上版本,请关闭“兼容性视图”。
Apache Kylin&Alluxio Meetup @上海 - 活动详情页 - 开源中国社区
Apache Kylin&Alluxio Meetup @上海

Apache Kylin&Alluxio Meetup @上海

状态: 活动已结束
时间: 2016-11-21 18:00 至 21:00
地点:上海 浦东 金科路3057号(汇智国际商业中心2楼203室)临时书店咖啡馆 查看地图
费用:免费
  • 活动已结束
  • 分享

Alluxio,前称Tachyon,是一个开源内存级虚拟大数据存储系统,帮助实现不同数据源的融合和高速访问。通过Alluxio,不同的计算框架可以以一个统一的接口无缝访问不同数据源中的数据,从而可以专注高效的创新和迭代;同时与Alluxio对接的持久化存储系统可以专注更高效的存储效率。同时Alluxio自带的以内存为核心的存储架构性能更强大、计算和存储的可伸缩更方便。现在Alluxio支持多种存储系统包括Amazon S3、谷歌云存储、Gluster、Ceph、HDFS、NFS和OpenStack Swift等;支持多种主流大数据处理框架,包括Spark,MapReduce等。

Apache Kylin是可扩展到PB规模的开源分布式大数据分析引擎,为Apache Hadoop等大型分布式数据平台之上的超大规模数据集提供标准SQL查询及多维分析(OLAP)能力,提供亚秒级的交互式分析能力。

2014年11 月,Kylin加入Apache孵化器项目,经过不到一年的发展,于2015年11月顺利毕业成为Apache顶级项目之一。Apache Kylin是首个完全由中国团队设计开发,并贡献到Apache软件基金会(ASF)的顶级项目,开源一年左右的时间,已经在国内国际多个公司被采用作为大数据分析平台的关键组成部分,包括eBay、Expedia、Exponential、百度、京东、美团、明略数据、网易、中国移动、唯品会等。

本次Kylin&Alluxio线下活动来到技术核心地——上海,主题围绕Alluxio新功能(包括可扩展的分层存储、透明的同步数据读写、统一命名空间)、Apache Kylin流式OLAP的最新设计以及唯品会数据千余个维度和指标的实践应用案例等话题,邀请了来自Alluxio、Kylin、唯品会的技术专家来介绍相关议题。

主办:Kyligence Inc.

时间:2016年11月21日 18:00 至 21:00

地点:金科路3057号(汇智国际商业中心2楼203室)临时书店咖啡馆

活动咨询:yun.xing@kyligence.io

活动议程

18:00 - 18:30       签到


18:30 - 19:10       Alluxio: 构建高速大数据融合存储平台              ( 范斌|Alluxio) 



19:10 - 19:50      Apache Kylin Streaming OLAP and Future     ( 李扬|Kyligence)


19:50 - 20:30       Apache Kylin在唯品会大数据的应用                (谢麟炯|唯品会 )


20:30 - 21:00       合影&自由交流

演讲内容及嘉宾介绍

主题一:Alluxio: 构建高速大数据融合存储平台

范斌:范斌博士就职于Alluxio Inc., 是目前Alluxio开源项目的核心开发者之一. 加入Alluxio Inc.之前范斌曾于谷歌工作, 从事下一代大规模分布式存储系统的研究与开发, 并因此获得谷歌Technical Infrastructure Award. 范斌曾在卡耐基梅陇大学(Carnegie Mellon University)攻读并获得计算机博士学位, 有多篇学术论文发表在SIGCOMM, SOSP, NSDI等网络和分布式系统方向的顶级计算机学术会议.

主题摘要:Alluxio,前称Tachyon,是一个开源内存级虚拟大数据存储系统,帮助实现不同数据源的融合和高速访问。通过Alluxio,不同的计算框架可以以一个统一的接口无缝访问不同数据源中的数据,从而可以专注高效的创新和迭代;同时与Alluxio对接的持久化存储系统可以专注更高效的存储效率。同时Alluxio自带的以内存为核心的存储架构性能更强大、计算和存储的可伸缩更方便。现在Alluxio支持多种存储系统包括Amazon S3、谷歌云存储、Gluster、Ceph、HDFS、NFS和OpenStack Swift等;支持多种主流大数据处理框架,包括Spark,MapReduce等。

Alluxio项目最早起源于加州大学伯克利分校AMPLab的研究项目。 在其开源的三年的时间里,Alluxio社区已汇集全世界100多家公司的超过300名贡献者, 并被部署使用在例如百度、巴克莱银行、去哪儿网等公司的生产环境中,Alluxio已经其中一些部署应用中运行了一年多,管理着PB级别的数据。

Alluxio PMC Maintainer 范斌会详细讲解和示范Alluxio的新功能,包括可扩展的分层存储、透明的同步数据读写、统一命名空间等。这些功能为Alluxio用户带来更多的价值和更高效便捷的集群存储管理。与此同时,也将介绍和分析Alluxio在不同生产部署的使用案例。

主题二:Apache Kylin Streaming OLAP and Future

李扬:联合创始人兼CTO,Apache Kylin 联合创建者及项目管理委员会成员(PMC), 主创团队架构师和技术负责人,专注于大数据分析,并行计算,数据索引,关系数学,近似算法,压缩算法等前沿技术。曾任eBay全球分析基础架构部大数据资深架构师、IBM InfoSphere BigInsights的技术负责人,负责Hadoop开源产品架构,“杰出技术贡献奖”的获奖者、摩根士丹利副总裁,负责全球监管报表基础架构

演讲摘要:介绍Apache Kylin流式OLAP的历史及其最新设计和成就。 讨论如何以接近实时的方式完成cubing,以及如何在未排序的记录流中实现零数据丢失。 浅探Apache Kylin、雪花模型和真正的实时分析的未来。

主题三:Apache Kylin在唯品会大数据的应用

谢麟炯:唯品会大数据平台高级技术架构经理,主要负责大数据自助多维分析平台,离线数据开发平台及分析引擎团队的开发和管理工作,加入唯品会以来还曾负责流量基础数据的采集和数据仓库建设以及移动流量分析等数据产品的工作。

主题摘要:唯品会大数据现有多个数据产品,数据覆盖了所有特卖业务的需求,有千余个维度和指标,传统的基于Hive的统计汇总到数据同步展示难以满足需要,如何让ad-hoc的响应速度快起来是一个需要解决的难题。本次分享将从Apache Kylin是如何为平台提速入手,讨论准实时OLAP在唯品会的应用。

更多关于Apache Kylin的信息,

请访问网站:http://kylin.apache.org及关注微信公众号

评论
评论
没有更多评论
top Created with Sketch. 顶部