バージョン: Candidate-4.1

データロード

📄️ ローカルファイルシステムからデータをロードする

StarRocks はローカルファイルシステムからデータをロードするための2つの方法を提供しています。

📄️ HDFS からのデータロード

StarRocks は、HDFS からデータをロードするために次のオプションを提供します。

📄️ INSERT を使用したデータのロード

このトピックでは、SQL ステートメント - INSERT を使用して StarRocks にデータをロードする方法について説明します。

📄️ SQL トランザクション

シンプル SQL トランザクションを開始し、複数の DML ステートメントをバッチでコミットする。

📄️ Stream Load トランザクションインターフェースを使用したデータのロード

バージョン 2.4 以降、StarRocks は Stream Load トランザクションインターフェースを提供し、Apache Flink® や Apache Kafka® などの外部システムからデータをロードするために実行されるトランザクションに対して、2 フェーズコミット (2PC) を実装します。Stream Load トランザクションインターフェースは、高度に並行したストリームロードのパフォーマンスを向上させます。

📄️ MySQL からのリアルタイム同期

StarRocks は、MySQL から StarRocks へのデータをリアルタイムで同期する複数の方法をサポートしており、大量データの低遅延リアルタイム分析を実現します。

📄️ Apache Flink® からデータを継続的にロードする

StarRocks は、Apache Flink® 用の StarRocks Connector（以下、Flink コネクタ）という独自開発のコネクタを提供しており、Flink を使用して StarRocks テーブルにデータをロードするのに役立ちます。基本的な原理は、データを蓄積し、それを一度に StarRocks に STREAM LOAD を通じてロードすることです。

📄️ Apache® Pulsar™ からのデータを継続的にロードする

StarRocks バージョン 2.5 から、Routine Load は Apache® Pulsar™ からのデータを継続的にロードすることをサポートしています。Pulsar は、ストアとコンピュートの分離アーキテクチャを持つ、分散型のオープンソースの pub-sub メッセージングおよびストリーミングプラットフォームです。Routine Load を介して Pulsar からデータをロードすることは、Apache Kafka からデータをロードすることに似ています。このトピックでは、CSV 形式のデータを例に、Routine Load を介して Apache Pulsar からデータをロードする方法を紹介します。

データロード

🗃️ ロード概要

🗃️ オブジェクトストレージからのロード

📄️ ローカルファイルシステムからデータをロードする

📄️ HDFS からのデータロード

🗃️ Apache Kafka からのデータロード

🗃️ Apache Spark からのデータロード

📄️ INSERT を使用したデータのロード

📄️ SQL トランザクション

📄️ Stream Load トランザクションインターフェースを使用したデータのロード

📄️ MySQL からのリアルタイム同期

📄️ Apache Flink® からデータを継続的にロードする

📄️ Apache® Pulsar™ からのデータを継続的にロードする

📄️ ロードによるデータ変更

📄️ ロード時のデータ変換

📄️ ツールを使用したデータロード

📄️ Strict mode

このドキュメントについてどう思いましたか？