Apache Spark有三种分布式部署方式,包括Spark On Mesos模式、Spark On YARN模式和独立模式(standalone)。本次演讲会详细描述如何集成Spark和Mesos,以支持Spark作业的集群化,我们将介绍在典型的Spark作业生命周期间出现的事件序列。我们还将探讨一些优化性能和资源利用的建议,以及如何避免已知的一些问题。此外,我们还将探讨Spark on Mesos未来可能的一些工作。再次过程中,我们会了解Spark为支持集群化暴露处的抽象。
Timothy Chen就职于Mesosphere,是一位分布式系统专家,专注于容器化和大数据框架。他还是Apache Drill和Apache Mesos项目的PMC/贡献者,对Spark、Kafka和Docker等开源项目亦有贡献。在加入Mesosphere之前,Tim还从事过Halo上的大数据服务、CloudFoundry (PaaS)和搜索引擎方面的经验。
|