¿Cómo crear un DataFrame vacío con un esquema especificado?
Quiero crear un DataFrame
con un esquema especificado en Scala. He intentado utilizar JSON leer (me refiero a la lectura de archivos vacíos), pero no creo que eso es la mejor práctica.
79
3
Supongamos que desea un marco de datos con el siguiente esquema:
idioma: ninguno -->
Basta con definir el esquema para un marco de datos y utilizar
RDD[Row]
vacío:lenguaje: scala -->
El equivalente en PySpark es casi idéntico:
lenguaje: python -->
Uso de codificadores implícitos (sólo Scala) con tipos
Product
comoTuple
:lenguaje: scala -->
o case class:
lenguaje: scala -->
o
A partir de Spark 2.0.0, puedes hacer lo siguiente.
Case Class
Definamos una clase de caso
Persona
:Importar
spark
SparkSession implícitoEncoders
:Y utilizar SparkSession para crear un
Dataset[Person]
vacío:Esquema DSL
También puedes usar un Esquema "DSL" (ver Funciones de soporte para DataFrames en org.apache.spark.sql.ColumnName).