鲁小亿

鲁小亿博士是美国俄亥俄州立大学计算机系的研究科学家(Research Scientist)。他目前的主要研究方向包括高性能互连网络和协议,大数据处理,Hadoop/Spark生态系统,并行计算模型(MPI/ PGAS), 虚拟化和云计算。他目前已经在这些研究领域的国际期刊和会议上发表论文50余篇,并一直在参与这些领域的国内外学术刊物和会议的各类专业活动,比如担任程序委员会共同主席和委员等等。更多内容请参见其个人主页:http://web.cse.ohio-state.edu/~luxi

演讲题目:利用高性能计算技术加速大数据管理与分析

摘要:现代高性能计算系统及相关中间件(如MPI和并行文件系统)已经在过去十几年中高效地利用了高性能计算发展的各种最新技术(如多/众核架构,具有RDMA功能的高性能网络,和高速存储设备SSD)。然而,当前的大数据管理和分析中间件(如Hadoop,Spark,和Memcached)还无法高效地采用这些最新高性能计算技术的发展成果。这种差异导致高性能计算和大数据处理两个社区的发展轨迹没有形成有机的结合。本演讲将首先探讨在现代集群上通过高性能计算技术加速大数据管理和分析的机会与挑战,并进一步讨论针对当前流行的大数据管理和分析中间件,如何进行基于RDMA和异构存储架构的增强设计。一些在不同高性能计算机群上的重要性能数据会进行分享。本演讲还会讨论使用多层设计方法来解决大数据管理与分析过程中如何更加有效地进行系统软件的基准测试问题。所有这些工作的目的是希望将高性能计算和大数据处理的发展引导成为一条“融合的轨迹”。

能计算技术加速大数据管理和分析的机会与挑战,并进一步讨论针对当前流行的大数据管理和分析中间件,如何进行基于RDMA和异构存储架构的增强设计。一些在不同高性能计算机群上的重要性能数据会进行分享。本演讲还会讨论使用多层设计方法来解决大数据管理与分析过程中如何更加有效地进行系统软件的基准测试问题。所有这些工作的目的是希望将高性能计算和大数据处理的发展引导成为一条“融合的轨迹”。