loading_spark | StarRocks

バージョン: Candidate-4.1

📄️ Spark コネクタを使用してデータをロードする（推奨）

StarRocks は、Apache Spark™ 用に開発したコネクタである StarRocks Connector for Apache Spark™（以下、Spark コネクタ）を提供しています。これを使用して、Spark を介して StarRocks テーブルにデータをロードできます。基本的な原理は、データを蓄積し、STREAM LOAD を通じて一度に StarRocks にロードすることです。Spark コネクタは Spark DataSource V2 に基づいて実装されています。DataSource は Spark DataFrames または Spark SQL を使用して作成できます。バッチモードと構造化ストリーミングモードの両方がサポートされています。

📄️ Spark Load を使用してデータを一括ロードする

このロードは、外部の Apache Spark™ リソースを使用してインポートデータを事前処理し、インポートのパフォーマンスを向上させ、計算リソースを節約します。主に初期移行や大規模データインポートに使用され、StarRocks へのデータ量は TB レベルまで対応します。

📄️ Spark コネクタを使用してデータをロードする（推奨）

📄️ Spark Load を使用してデータを一括ロードする

このドキュメントについてどう思いましたか？