/images/avatar.jpg
杂七杂八的,随手记录。

Prefix Filter: Better Than Bloom

Table of Contents

本文为摘录(或转载),侵删,原文为: ../pdf/d/p1311-even.pdf

1 Abstract

2 INTRODUCTION

  • What is a filter

    属于近似查询 (approximate membership query), 用于判断独具是否在集合中。

    • 如果输入在集合中,则必定输出 Yes
    • 如果不在集合中,则输出 Yes 的概率不能多于 \(\Sigma\)
  • What are filters used for
    • 与精确查询相比
      • 更省资源, 与数据量无关,而与 Σ (误报率)有关
      • 适于放在内存中,用于真正操作之前来过滤掉无效数据
        • 比如 join

QueryFormer: A Tree Transformer Model for Query Plan Representation

Table of Contents

本文为摘录(或转载),侵删,原文为: attachments/pdf/0/p1658-zhao.pdf

QueryFormer:

  • learning-based query planer representation model
  • with tree-structured Transformer architecture

-integrate histograms from database into query plan encoding

1 INTRODUCTION

  • Physical Query Plan As DAG (Directed Acyclic Graph)

    Figure 1: Example query and query plan

    Figure 1: Example query and query plan

    • node 表示操作
    • edge 表示方向
    • 子节点先执行,执行结果给父节点作为输入
  • Physical Query Plan 作为机器学习的输入,用以数据库优化

Red Hat Enterprise Linux 7 Performance Tuning Guide

本文为摘录(或转载),侵删,原文为: attachments/pdf/c/red_hat_enterprise_linux-7-performance_tuning_guide-en-us.pdf

1 TOOLS

1.1 top

1.2 ps

1.3 vmstat – Virtual Memory Statistics

1.4 sar – System Activity Repoter

1.5 perf

1.6 tubostat

1.7 iostat

1.8 irqbalance

1.9 ss – socket statistics

1.10 numastat

1.11 numad

SA-LSM: Optimize Data Layout for LSM-tree Based Storage using Survial Analysis

Table of Contents

本文为摘录(或转载),侵删,原文为: attachments/pdf/5/p2161-zhang.pdf

1 ABSTRACT

  • 云存储中很大一部分数据很少被访问,被称为 冷数据
  • 精确地识别和有效地管理成本效益高的存储中的冷数据是云提供商面临的主要挑战之一,需要平衡降低成本和提高系统性能。
  • 为此,提出了 SA-LSM 来利用生存分析(Survival Analysis)的方式来处理 LSM-tree 键值(KV)存储。
  • 传统上,LSM-tree 的数据布局是由写操作和压实操作共同确定的。
  • 然而,该过程默认情况下并未充分利用数据记录的访问信息,导致次优的数据布局,对系统性能产生负面影响。
  • SA-LMS 使用生存分析,一种在生物统计学中常用的统计学习算法来优化数据布局。
  • 当与合适的 LSM-tree 实现结合使用时,SA-LSM 可以使用历史信息和访问痕迹准确预测冷数据。
  • 具体实现方面,将 SA-LSM 应用于商业化开源 LSM-tree 存储引擎 X-Engine
  • 了使部署更加灵活,还设计了一种非侵入式架构,可以将 CPU 密集型任务(例如模型训练和推断)卸载到外部服务上。
  • 在真实工作负载上的广泛实验表明,与现有技术相比,SA-LSM 可以将尾延迟降低高达 78.9%。
  • 这种方法的通用性和显著性能提升在相关应用中具有巨大潜力。

2 INTRODUCTION

为了降低存储成本,LSM 树变成了一种越来越受欢迎的架构。它引入了多层异构存储:

shared memory utilities

本文为摘录(或转载),侵删,原文为: https://linuxopsys.com/topics/check-shared-memory-in-linux

1 RTFM…

1.1 ipcs

1.2 ipcrm

2 Check shared memory in Linux

Print active shared memory segments using -m option.

1
2
3
4
5
# ipcs -m
------ Shared Memory Segments --------
key shmid owner perms bytes nattch status
0x00000000 65536 root 600 393216 2 dest
0x00000000 98305 root 600 393216 2 dest

where,