sql >> Databáze >  >> RDS >> Mysql

Jak převést 500GB SQL tabulku na Apache Parquet?

Apache Spark lze použít k tomu:

1.load your table from mysql via jdbc
2.save it as a parquet file

Příklad:

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
df = spark.read.jdbc("YOUR_MYSQL_JDBC_CONN_STRING",  "YOUR_TABLE",properties={"user": "YOUR_USER", "password": "YOUR_PASSWORD"})
df.write.parquet("YOUR_HDFS_FILE")


  1. SQL HAVING doložka pro začátečníky

  2. Automatické dokončování v klientovi příkazového řádku MySQL

  3. Převod řetězce s oddělovači na více hodnot v mysql

  4. PIVOT dotaz na odlišné záznamy