Sparkでunixのタイムスタンプを日付に変換する方法

Question

さらに

ソース非AMP版編集

Sparkでunixのタイムスタンプを日付に変換する方法

Unixタイムスタンプ(例：1435655706000)のカラムを持つデータフレームがあり、 'yyyy-MM-DD' のフォーマットでデータに変換したいのですが、 nscala-timeを試しましたがうまくいきません。

val time_col = sqlc.sql("select ts from mr").map(_(0).toString.toDateTime)
time_col.collect().foreach(println)

で、エラーが出ました。 java.lang.IllegalArgumentException:Invalid format: "1435655706000"は"6000&quotで不正なフォーマットです。

Hammad Haleem

編集された質問 9日 3月 2016 в 4:29

プログラミング

datetime timestamp scala apache-spark nscala-time

30日 6月 2015 в 9:51

5 ビュー

質問へのコメント (2)

Yuan Zhao · Answer 1 · 2016-06-01T13:16:35+00:00

Yuan Zhao

ソース非AMP版編集

spark1.5以降、それを行うための組み込みUDFがあります。

val df = sqlContext.sql("select from_unixtime(ts,'YYYY-MM-dd') as `ts` from mr")

詳細については、Spark 1.5.2 API Docを確認してください。

Yuan Zhao

編集した答え 1日 6月 2016 в 11:43

23

0

解説 (3)

Marsellus Wallace · Answer 2 · 2017-08-10T17:34:48+00:00

Marsellus Wallace

ソース非AMP版編集

ここでは、Scala DataFrame関数を使用しています:from_unixtimeおよびto_date。

// NOTE: divide by 1000 required if milliseconds
// e.g. 1446846655609 -> 2015-11-06 21:50:55 -> 2015-11-06 
mr.select(to_date(from_unixtime($"ts" / 1000)))

。

Logan

編集した答え 30日 10月 2018 в 11:44

22

0

解説 (1)

Hammad Haleem · Answer 3 · 2016-01-08T04:09:29+00:00

import org.joda.time.{DateTimeZone}
import org.joda.time.format.DateTimeFormat

以下のライブラリのインポートが必要です。

val stri = new DateTime(timeInMillisec).toDateTime.toString("yyyy/MM/dd")

または、あなたのケースに合わせて:

 val time_col = sqlContext.sql("select ts from mr")
                     .map(line => new DateTime(line(0).toInt).toDateTime.toString("yyyy/MM/dd"))

他の方法があるかもしれません．

  import com.github.nscala_time.time.Imports._

  val date = (new DateTime() + ((threshold.toDouble)/1000).toInt.seconds )
             .toString("yyyy/MM/dd")

これが役に立つといいのですが :)

Orar · Answer 4 · 2016-05-18T23:27:25+00:00

Orar

ソース非AMP版編集

nscala_time で toDataTime を適用する前に String に変換する必要はない。

import com.github.nscala_time.time.Imports._ とする．

scala> 1435655706000L.toDateTime
res4: org.joda.time.DateTime = 2015-06-30T09:15:06.000Z

`

6

0

解説 (0)

youngchampion · Answer 5 · 2015-07-01T07:57:10+00:00

youngchampion

ソース非AMP版編集

私は、joda-time ライブラリを使用して、DataFrameにマッピングし、DateTimeをStringに変換することによって、この問題を解決しました。

import org.joda.time._
val time_col = sqlContext.sql("select ts from mr")
                         .map(line => new DateTime(line(0)).toString("yyyy-MM-dd"))

eliasah

編集した答え 9日 11月 2015 в 1:18

6

0

解説 (0)

Abhinav Kaushal Keshari · Answer 6 · 2018-09-19T09:30:50+00:00

あなたができることは:

input.withColumn("time", concat(from_unixtime(input.col("COL_WITH_UNIX_TIME")/1000,
"yyyy-MM-dd'T'HH:mm:ss"), typedLit("."), substring(input.col("COL_WITH_UNIX_TIME"), 11, 3), 
typedLit("Z")))

ここで、時間は新しい列名であり、COL_WITH_UNIX_TIMEは変換する列の名前です。これにより、ミリ単位でデータが表示され、データがより正確になります。たとえば、「yyyy-MM-dd'T'HH:mm:ss.SSS'Z」」などです。

Alex Stanovsky · Answer 7 · 2019-02-25T09:40:23+00:00

Alex Stanovsky

ソース非AMP版編集

Javaでは次の構文を使用できます。

input.select("timestamp)
            .withColumn("date", date_format(col("timestamp").$div(1000).cast(DataTypes.TimestampType), "yyyyMMdd").cast(DataTypes.IntegerType))

1

0

解説 (0)