EXPORT を使用したデータのエクスポート
このトピックでは、StarRocks クラスター内の指定されたテーブルやパーティションからデータを CSV データファイルとして外部ストレージシステムにエクスポートする方法について説明します。外部ストレージシステムは、分散ファイルシステム HDFS や AWS S3 などのクラウドストレージシステムである可能性があります。
注意
StarRocks テーブルからデータをエクスポートするには、その StarRocks テーブルに対して EXPORT 権限を持つユーザーである必要があります。EXPORT 権限がない場合は、GRANT に従って、StarRocks クラスターに接続するために使用するユーザーに EXPORT 権限を付与してください。
背景情報
バージョン 2.4 以前では、StarRocks はデータをエクスポートする際に、StarRocks クラスターと外部ストレージシステム間の接続を設定するためにブローカーに依存していました。そのため、EXPORT ステートメントで使用するブローカーを指定するために WITH BROKER "<broker_name>" を入力する必要がありました。これを「ブローカーを使用したアンロード」と呼びます。ブローカーは独立したステートレスサービスであり、ファイル システムインターフェースと統合されており、StarRocks が外部ストレージシステムにデータをエクスポートするのを支援します。
バージョン 2.5 以降、StarRocks はデータをエクスポートする際に、StarRocks クラスターと外部ストレージシステム間の接続を設定するためにブローカーに依存しなくなりました。そのため、EXPORT ステートメントでブローカーを指定する必要はありませんが、WITH BROKER キーワードは保持する必要があります。これを「ブローカーを使用しないアンロード」と呼びます。
ただし、データが HDFS に保存されている場合、ブローカーを使用しないアンロードが機能しないことがあり、ブローカーを使用したアンロードに頼ることができます。
- 複数の HDFS クラスターにデータをエクスポートする場合、これらの HDFS クラスターごとに独立したブローカーを展開して構成する必要があります。
- 単一の HDFS クラスターにデータをエクスポートし、複数の Kerberos ユーザーを構成している場合、独立したブローカーを 1 つ展開する必要があります。
サポートされているストレージシステム
- 分散ファイルシステム HDFS
- AWS S3 などのクラウドストレージシステム