版本：Latest-4.1

导入数据

🗃️ 导入概览

5 个项目

🗃️ 从对象存储导入

8 个项目

📄️ 从本地文件系统导入数据

从本地文件系统使用 Stream Load 同步导入或 Broker Load 异步导入数据到 StarRocks，支持多种文件格式。

📄️ 从 HDFS 导入

从 HDFS 导入数据到 StarRocks，支持 Parquet、ORC 和 CSV 等格式。

🗃️ 从 Apache Kafka® 导入

2 个项目

🗃️ 从 Apache Spark™ 导入

2 个项目

📄️ 通过 INSERT 语句导入数据

通过 INSERT 语句向 StarRocks 导入数据：INSERT VALUES、INSERT INTO SELECT 和动态覆盖。

📄️ SQL 事务

使用 SQL 事务以原子方式在 StarRocks 中提交多个 INSERT、UPDATE、DELETE 语句，支持 ACID 特性。

📄️ 使用 Stream Load 事务接口导入

使用 Stream Load 事务接口实现两阶段提交，支持 Flink 和 Kafka 等系统的高并发流式导入和多表事务。

📄️ 从 MySQL 实时同步

使用 Flink CDC 捕获 MySQL 变更数据，实时同步至 StarRocks 进行秒级更新。

📄️ 从 Apache Flink® 持续导入

通过 Apache Flink connector 持续加载数据到 StarRocks，支持 DataStream、Table API 和 Python API。

📄️ 使用 Apache Flink® 通过多表事务加载数据

为 Flink 作业启用多表事务，以便在一个处理周期内向同一数据库中的多个表写入数据。

📄️ 从 Apache® Pulsar™ 持续导入数据

通过 Routine Load 从 Apache Pulsar 主题持续导入 CSV 和 JSON 格式数据到 StarRocks。

📄️ 通过导入实现数据变更

在 Primary Key 表中通过 Stream Load、Broker Load 或 Routine Load 实现 INSERT、UPDATE、DELETE 操作。

📄️ 导入过程中实现数据转换

在导入过程中实现数据转换：列映射、过滤条件及派生列表达式在多种导入方式中的应用。

📄️ 使用工具导入

除了导入章节上面重点介绍的几种导入方式外，StarRocks 和生态伙伴还提供如下工具支持帮助您轻松实现 StarRocks 与外部数据库的集成。

📄️ 严格模式

严格模式控制导入过程中如何处理数据类型转换失败的行，决定是否过滤无效数据。