Amazon Athena のパフォーマンスチューニング Tips トップ 10


AWSのAthenaのパフォーマンスチューニングの話。
オンプレでPrestoを利用する際にも適用出来る内容だと思います。
ちょうどオンプレでPresto利用しようとしているので参考にしよう。
システムに限らないけど、やっぱ道具の特性は押さえないとダメですね。。

Amazon Athena のパフォーマンスチューニング Tips トップ 10 | Amazon Web Services ブログ

  1. データをパーティションに分ける
  2. ファイルを圧縮・分割する
  3. ファイルサイズを最適化する
  4. 列指向データの作成を最適化する
  5. ORDER BY を最適化する
  6. JOIN を最適化する
  7. GROUP BY を最適化する
  8. LIKE 演算子を最適化する
  9. 近似関数を使う
  10. 必要なカラムだけを読み込む