导入数据
🗃️ 导入概览
5 个项目
🗃️ 从对象存储导入
8 个项目
📄️ 从本地文件系统导入数据
从本地文件系统使用 Stream Load 同步导入或 Broker Load 异步导入数据到 StarRocks,支持多种文件格式。
📄️ 从 HDFS 导入
从 HDFS 导入数据到 StarRocks,支持 Parquet、ORC 和 CSV 等格式。
🗃️ 从 Apache Kafka® 导入
2 个项目
🗃️ 从 Apache Spark™ 导入
2 个项目
📄️ 通过 INSERT 语句导入数据
通过 INSERT 语句向 StarRocks 导入数据:INSERT VALUES、INSERT INTO SELECT 和动态覆盖。
📄️ SQL 事务
使用 SQL 事务以原子方式在 StarRocks 中提交多个 INSERT、UPDATE、DELETE 语句,支持 ACID 特性。
📄️ 使用 Stream Load 事务接口导入
使用 Stream Load 事务接口实现两阶段提交,支持 Flink 和 Kafka 等系统的高并发流式导入和多表事务。
📄️ 从 MySQL 实时同步
使用 Flink CDC 捕获 MySQL 变更数据,实时同步至 StarRocks 进行秒级更新。
📄️ 从 Apache Flink® 持续导入
通过 Apache Flink connector 持续加载数据到 StarRocks,支持 DataStream、Table API 和 Python API。
📄️ 从 Apache® Pulsar™ 持续导入数据
通过 Routine Load 从 Apache Pulsar 主题持续导入 CSV 和 JSON 格式数据到 StarRocks。
📄️ 通过导入实现数据变更
在 Primary Key 表中通过 Stream Load、Broker Load 或 Routine Load 实现 INSERT、UPDATE、DELETE 操作。
📄️ 导入过程中实现数据转换
在导入过程中实现数据转换:列映射、过滤条件及派生列表达式在多种导入方式中的应用。
📄️ 使用工具导入
除了导入章节上面重点介绍的几种导入方式外,StarRocks 和生态伙伴还提供如下工具支持帮助您轻松实现 StarRocks 与外部数据库的集成。
📄️ 严格模式
严格模式控制导入过程中如何处理数据类型转换失败的行,决定是否过滤无效数据。