使用 GCP Dataproc Serverless(Java)將數據從 Redshift 導出到 GCS 的方法。Dataproc Serverless 允許您運行 Spark 批處理工作流,無需自己配置和管理集群。該服務將在受管理的計算基礎設施上運行工作流,根據需要自動調整資源。使用 dataproc serverless 時,只需指定工作流參數並提交工作流到服務。有一個名為 Redshift to GCS 的模板可用於將數據從 Redshift 導出到 GCS,支持 Parquet、AVRO、CSV 和 JSON 格式。運行這些模板需要一些先決條件,例如安裝並驗證 Google Cloud SDK、Java 8+等。具體操作步驟可以參考原文提供的鏈接。
via Google Cloud – Community – Medium
November 21, 2023 at 10:22PM