Amazon Athenaとは

Amazon Athena

Amazon Athena はインタラクティブなクエリサービスで、Amazon S3 内のデータを標準 SQL を使用して簡単に分析できます。Athena はサーバーレスなので、インフラストラクチャの管理は不要です。実行したクエリに対してのみ料金が発生します。

Amazon S3 にあるデータを指定し、スキーマを定義し、標準的な SQL を使用してクエリの実行を開始するだけです。

初期状態で AWS Glueデータカタログと統合されており、さまざまなサービスにわたるメタデータの統合リポジトリを作成できます。データソースのクロールとスキーマの解析、新規および修正したテーブル定義とパーティション定義のカタログへの入力、スキーマのバージョニング保持が可能です。

AzureでいうとData Lake Analytics と Azure Synapse Analytics 的なもの

利点

サーバーレス、ETLなし

Athena はサーバーレスです。すぐにデータのクエリを実行できるため、サーバーやデータウェアハウスの設定や管理は不要です。Amazon S3 にあるデータを指定して、スキーマを定義し、組み込まれているクエリエディタを使ってクエリを開始できます。Amazon Athena を使用すると、S3 にあるユーザーのすべてのデータを利用できるため、データの抽出、変換、ロード (ETL) といった複雑なプロセスは必要ありません。

スキャンしたデータに対してのみ支払い

Amazon Athena では、実行するクエリに対してのみ料金が発生します。クエリごとにスキャンされたデータの分量に基づいて料金が請求され、1 テラバイトごとに 5 USD が請求されます。

Presto ビルド、標準 SQL 実行

Amazon Athena には ANSI SQL に準拠した Presto が使われており、CSV、JSON、ORCParquet などのさまざまな標準データフォーマットに対応し、機能します。Athena は迅速で、アドホックなクエリ問い合わせ方法として理想的です。

参考: