Našel jsem jednodušší způsob práce s připojením JDBC v Glue. Způsob, jakým tým Glue doporučuje zkrátit tabulku, je pomocí následujícího vzorového kódu, když zapisujete data do clusteru Redshift:
datasink5 = glueContext.write_dynamic_frame.from_jdbc_conf(frame = resolvechoice4, catalog_connection = "<connection-name>", connection_options = {"dbtable": "<target-table>", "database": "testdb", "preactions":"TRUNCATE TABLE <table-name>"}, redshift_tmp_dir = args["TempDir"], transformation_ctx = "datasink5")
kde
connection-name your Glue connection name to your Redshift Cluster
target-table the table you're loading the data in
testdb name of the database
table-name name of the table to truncate (ideally the table you're loading into)