从特定列中获取最小值和最大值 scala spark dataframe
我想访问数据帧中特定列的最小值和最大值,但我没有该列的标题,只有它的编号,所以我应该使用 scala 吗?
也许可以这样做
val q = nextInt(ncol) //we pick a random value for a column number
col = df(q)
val minimum = col.min()
对不起,如果这听起来像一个愚蠢的问题,但我无法找到任何关于这个问题的信息SO :/ /。
18
3
从元数据中获取列名如何?
在分配变量时,可以使用模式匹配:
其中,q 是 "列 "或列名(字符串)。假设数据类型为 "Double"。
您可以先使用列编号提取列名(通过索引
df.columns
),然后使用列名进行聚合: