Towards a New File Format for Big Data - SIMD-Friendly Composable Compression
本文为摘录(或转载),侵删,原文为: attachments/pdf/a/Towards a New File Format for Big Data - SIMD-Friendly Composable Compression (2020-AzimAfroozeh).pdf
1 Introduction
2 Related Work
2.1 Storage Layouts
2.1.1 NSM
传统上,在数据库系统中,表格数据通常按照磁盘页的起始行逐行存储。这种存储方式被称为 N-ary 存储模型(NSM)。如图 2.1 所示,如果元组大小是可变的,NSM 可能会在页面末尾使用偏移表来定位每个元组的起始位置。此外,每个元组都以元组头(RH)开头,包含有关元组的信息。RH 以空位图开头,用于支持空值;以偏移量开头,用于支持可变属性的变量长度值;以及其他实现特定的细节,以使布局更加灵活。