가변수 생성합니다.

난 다음 더미 com/go/4e6b330a_kr 생성하는 데 어려움을 겪고 있는 r:

39 m, 시계열 데이터 분석 i& 연간 (기간 1948-2009년). 나는 두 가지 질문을합니다.

  1. 10 대한 관찰, 즉 어떻게 작성합니까 가변수 (가치 = 1 (1957년) 는 1957년, 제로 그렇지 않으면)?

  2. 가변수 어떻게 작성합니까 수행하고 있는 이 값을 1 로 2009년 이후 1957년, 1957년 이전에?

또 다른 옵션은 더 많은 변수로 작동할 수 있는 경우 '와' 는 '팩터에서의 모델스마트리스'.

> year.f = factor(year)
> dummies = model.matrix(~year.f)

이렇게 하면 각 열 (모든 수준들과), 다른 하나는 열을 포함되어 요격할 수 있는 데이터 세트 1 년, 이를 제외한 포지셔닝합니다 default&quot "; 또는 값을 했다.

어떻게 &quot, default&quot 변경할 수 있습니다. '에서' '와' 콘트레스트스콜라리 모델스마트리스 메싱 선택하면 됩니다.

또한, 요격할 수 있는 첫 번째 열에 드롭합니다 스케쳐내 생략하십시오 됩니다 '또는' 추가 +0 끝까지 공식.

ᄋ "이번 할 수 있다.

해설 (10)

이러한 더미 깔의 com/go/4e6b330a_kr 뭐가 가장 간단한 방법은 다음과 같습니다.

> print(year)
[1] 1956 1957 1957 1958 1958 1959
> dummy  print(dummy)
[1] 0 1 1 0 0 0
> dummy2 = 1957)
> print(dummy2)
[1] 0 1 1 1 1 1

보다 일반적으로, 두 값 중 하나를 선택할 수 있는 조건을 따라 '' 세페우스 사용할 수 있습니다. 만일 당신이 원하는 어떤 이유로든 0-1 가변수 대신 사용할 수 있다고, 4, 7 번 '세페우스 사용할 수 있습니다 (년 = 1957년, 4, 7)'.

해설 (0)

[바보들을 더미 ()] 를 사용하여 (https://CRAN.R-project.org/package) = 인형):


library(dummies)

# example data
df1 
해설 (4)

'에는' 패키지 '마라 크리스더미페이터스' 이 목적:


library(mlr)
df 
해설 (2)

여기에 대답을 오퍼링에 직접판매용 라우팅합니다 작업 중 이를 달성할 수 있는 다른 많은 모델 (예: "lm") 는 내부적으로 당신꺼에요 할 겁니다. 그럼에도 불구하고, 다음은 더미 com/go/4e6b330a_kr 최대 Kuhn& 만들기 위해 여러 가지 방안을 # 39 의 인기 ['캐릿'] (https://topepo.github.io/caret/index.html) 및 ['요리'] (https://topepo.github.io/recipes/) 쉽다. 조금 더 자세히, 그들은 쉽게 확장할 수 있으며, 더 복잡한 상황에 맞는 동안 모두 해당 프레임워크와도 잘 된다.

['캐릿 도미바르스'] (https://topepo.github.io/caret/pre-processing.html # 더미 com/go/4e6b330a_kr 만들기)

'을 (를)', 'a', '도미바르스 캐릿 관련 기능을 사용할 수 있는 데이터 프레임을' 방식을 적용하십시오 디스크입니다. diskid 있다.

<! - 모든 언어: &gt 랑 r -;

df  
#> Formula: ~.
#> 2 variables, 1 factors
#> Variables and levels will be separated by '.'
#> A full rank encoding is used

predict(dummy, df)
#>   letter.b letter.c y
#> 1        0        0 1
#> 2        0        0 2
#> 3        1        0 3
#> 4        1        0 4
#> 5        0        1 5
#> 6        0        1 6

['recipes::step_dummy'] (https://topepo.github.io/recipes/reference/step_dummy.html)

비법 '을 (를)', '관련 기능은 step_dummy':

library(recipes)

dummy_recipe % 
    step_dummy(letter)

dummy_recipe
#> Data Recipe
#> 
#> Inputs:
#> 
#>       role #variables
#>    outcome          1
#>  predictor          1
#> 
#> Steps:
#> 
#> Dummy variables from letter

'준비' 와 '를 사용하여 데이터 푸십시오 컨텍스트로 따라 인컨텍스트 베이크' 또는 'juice':

# Prep and bake on new data...
dummy_recipe %>% 
    prep() %>% 
    bake(df)
#> # A tibble: 6 x 3
#>       y letter_b letter_c
#>           
#> 1     1        0        0
#> 2     2        0        0
#> 3     3        1        0
#> 4     4        1        0
#> 5     5        0        1
#> 6     6        0        1

# ...or use `retain = TRUE` and `juice` to extract training data
dummy_recipe %>% 
    prep(retain = TRUE) %>% 
    juice()
#> # A tibble: 6 x 3
#>       y letter_b letter_c
#>           
#> 1     1        0        0
#> 2     2        0        0
#> 3     3        1        0
#> 4     4        1        0
#> 5     5        0        1
#> 6     6        0        1
해설 (0)

일반적으로 이러한 종류의 더미 com/go/4e6b330a_kr 작동합니까 내가 할 수 있다.

  • (1) 에 대한 관찰, 즉 1957년 # 10 어떻게 작성합니까 가변수 (가치 = 1 (1957년, 제로 그렇지 않으면) *

data$factor_year_1 
해설 (0)

미하이 에미네스쿠 (우스카스 대한 질문에 대한 논리적 찼음을 곱합니다 놈팽이한테 수도 있습니다 함께 '1' (또는 어쩌면 더 '와' 1L):


# example data
df1 
해설 (0)

내가 읽고 있는 이 카글 포럼:


#Generate example dataframe with character column
example 
해설 (0)

대신 더미 com/go/4e6b330a_kr afaq 스케쳐내 ᄀ씨 K-1 으로 종료기:

dummies = table(1:length(year),as.factor(year))  

베스트,

해설 (1)

이 ',' 세페우스 https://stat.ethz.ch/R-manual/R-devel/library/base/html/ifelse.html";; a href = &quot &lt &gt &lt /a>; 가장 단순한 논리 함수를 이런 식이었다.

> x   [1] 1 1 1 1 1 1 1 1 0 0 0

또한 당신이 원한다면 반환되기를 문자 데이터 어졌다면 그렇게 할 수 있습니다.

> x   [1] "foo" "foo" "foo" "foo" "foo" "foo" "foo" "foo" "bar" "bar" "bar"

범주 com/go/4e6b330a_kr 함께 중첩하기.

> x   [1] "baz" "baz" "baz" "baz" "baz" "baz" "baz" "foo" "bar" "baz" "baz"

이것은 가장 쉽게 사용할 수 있습니다.

해설 (0)

또 다른 방법은 '에서' 패키지 '를 사용하는 것이 마타불라트 크다pto올스 (예:


df 
해설 (0)

내가 이런 기능을 사용하여 (backup-to-disk 데이타스터블):

# Ta funkcja dla obiektu data.table i zmiennej var.name typu factor tworzy dummy variables o nazwach "var.name: (level1)"
factorToDummy  new.names
  dtable[, (new.names) := transpose(lapply(get(var.name), FUN = function(x){x == levels(get(var.name))})) ]

  cat(paste("\nDodano zmienne dummy: ", paste0(new.names, collapse = ", ")))
}

사용법:


data 
해설 (0)

데이터를 데이타스터블 및 사용 및 행일 필터링부터 참조별로 설정되었습니다 변환할 수 있습니다


library(data.table)

dt 
해설 (0)

우리는 '에서' cSplit_e 스플리트스타크샤피 '도 사용할 수 있다. # 39 의 데이터를 사용하여 @zx8754&.


df1 
해설 (0)

또 다른 방법을 사용해야 할 수 있다.

ifelse(year < 1965 , 1, 0)
해설 (0)

내가 이 글을 작성할 수 있는 일반 기능에서는 아아아안녀어엉 가변수 복제하므로 기능을 근본적으로 바꾸기 Stata.

만약 x 는 x 와 난 로렌아줌마가 더미 (dummy) 는 데이터 프레임을 'a' 라는 변수를 가치 있는 'b' 는 '1' 가치 'c' 가 앨리어스보다 때 x $


introducedummy
해설 (0)