摘要 : 本文围绕数据湖应用背景下海量数据的高性能存取需求,以新型数据存储模型和分布式存储及缓存机制为目标,通过对数据湖存储结构、数据访问模式和数据处理方法进行分析,开展数据湖存取性能优化问题研究.首先,结合数据湖系统中的文件系统存储方式,设计了... 展开
作者 | 赵卓峰 陈元 梅宇生 |
---|---|
作者单位 | |
英文名称 | Research on Data Parallel Processing Technology for Data Lake Access Performance Optimization |
期刊名称 | 《北方工业大学学报》 |
期刊英文名称 | 《Journal of North China University of Technology》 |
页码/总页数 | 1-10 / 10 |
语种/中图分类号 | 汉语 / TP392 |
关键词 | 数据湖 存取性能 数据分区 并行计算 索引优化 |
基金项目 | 国家自然科学基金国际合作与交流项目(62061136006) |
机标主题词 / 分类号 | 湖泊;存取;存储体系结构 / P941;TP333;TP333 |