가변수 생성합니다.

Question

Pantera

원본 비 AMP 버전 편집

가변수 생성합니다.

난 다음 더미 com/go/4e6b330a_kr 생성하는 데 어려움을 겪고 있는 r:

39 m, 시계열 데이터 분석 i& 연간 (기간 1948-2009년). 나는 두 가지 질문을합니다.

10 대한 관찰, 즉 어떻게 작성합니까 가변수 (가치 = 1 (1957년) 는 1957년, 제로 그렇지 않으면)?
가변수 어떻게 작성합니까 수행하고 있는 이 값을 1 로 2009년 이후 1957년, 1957년 이전에?

Jaap

편집된 질문16일 10월 2017 в 9:47

프로그래밍

r r-faq

2일 8월 2012 в 11:07

33 파운드

David J. Harris · Answer 1 · 2012-08-03T01:24:30+00:00

또 다른 옵션은 더 많은 변수로 작동할 수 있는 경우 '와' 는 '팩터에서의 모델스마트리스'.

> year.f = factor(year)
> dummies = model.matrix(~year.f)

이렇게 하면 각 열 (모든 수준들과), 다른 하나는 열을 포함되어 요격할 수 있는 데이터 세트 1 년, 이를 제외한 포지셔닝합니다 default&quot "; 또는 값을 했다.

어떻게 &quot, default&quot 변경할 수 있습니다. '에서' '와' 콘트레스트스콜라리 모델스마트리스 메싱 선택하면 됩니다.

또한, 요격할 수 있는 첫 번째 열에 드롭합니다 스케쳐내 생략하십시오 됩니다 '또는' 추가 +0 끝까지 공식.

ᄋ "이번 할 수 있다.

Martin O'Leary · Answer 2 · 2012-08-02T23:38:02+00:00

이러한 더미 깔의 com/go/4e6b330a_kr 뭐가 가장 간단한 방법은 다음과 같습니다.

> print(year)
[1] 1956 1957 1957 1958 1958 1959
> dummy  print(dummy)
[1] 0 1 1 0 0 0
> dummy2 = 1957)
> print(dummy2)
[1] 0 1 1 1 1 1

보다 일반적으로, 두 값 중 하나를 선택할 수 있는 조건을 따라 '' 세페우스 사용할 수 있습니다. 만일 당신이 원하는 어떤 이유로든 0-1 가변수 대신 사용할 수 있다고, 4, 7 번 '세페우스 사용할 수 있습니다 (년 = 1957년, 4, 7)'.

zx8754 · Answer 3 · 2016-10-31T13:34:32+00:00

zx8754

원본 비 AMP 버전 편집

[바보들을 더미 ()] 를 사용하여 (https://CRAN.R-project.org/package) = 인형):


library(dummies)

# example data
df1

zx8754

편집된 답변23일 7월 2018 в 10:26

43

0

해설 (4)

Enrique Pérez Herrero · Answer 4 · 2016-11-10T16:54:22+00:00

Enrique Pérez Herrero

원본 비 AMP 버전 편집

'에는' 패키지 '마라 크리스더미페이터스' 이 목적:


library(mlr)
df

xm1

편집된 답변21일 6월 2019 в 6:27

17

0

해설 (2)

alistaire · Answer 5 · 2017-12-17T21:59:55+00:00

여기에 대답을 오퍼링에 직접판매용 라우팅합니다 작업 중 이를 달성할 수 있는 다른 많은 모델 (예: "lm") 는 내부적으로 당신꺼에요 할 겁니다. 그럼에도 불구하고, 다음은 더미 com/go/4e6b330a_kr 최대 Kuhn& 만들기 위해 여러 가지 방안을 # 39 의 인기 ['캐릿'] (https://topepo.github.io/caret/index.html) 및 ['요리'] (https://topepo.github.io/recipes/) 쉽다. 조금 더 자세히, 그들은 쉽게 확장할 수 있으며, 더 복잡한 상황에 맞는 동안 모두 해당 프레임워크와도 잘 된다.

['캐릿 도미바르스'] (https://topepo.github.io/caret/pre-processing.html # 더미 com/go/4e6b330a_kr 만들기)

'을 (를)', 'a', '도미바르스 캐릿 관련 기능을 사용할 수 있는 데이터 프레임을' 방식을 적용하십시오 디스크입니다. diskid 있다.

<! - 모든 언어: &gt 랑 r -;

df  
#> Formula: ~.
#> 2 variables, 1 factors
#> Variables and levels will be separated by '.'
#> A full rank encoding is used

predict(dummy, df)
#>   letter.b letter.c y
#> 1        0        0 1
#> 2        0        0 2
#> 3        1        0 3
#> 4        1        0 4
#> 5        0        1 5
#> 6        0        1 6

['recipes::step_dummy'] (https://topepo.github.io/recipes/reference/step_dummy.html)

비법 '을 (를)', '관련 기능은 step_dummy':

library(recipes)

dummy_recipe % 
    step_dummy(letter)

dummy_recipe
#> Data Recipe
#> 
#> Inputs:
#> 
#>       role #variables
#>    outcome          1
#>  predictor          1
#> 
#> Steps:
#> 
#> Dummy variables from letter

'준비' 와 '를 사용하여 데이터 푸십시오 컨텍스트로 따라 인컨텍스트 베이크' 또는 'juice':

# Prep and bake on new data...
dummy_recipe %>% 
    prep() %>% 
    bake(df)
#> # A tibble: 6 x 3
#>       y letter_b letter_c
#>           
#> 1     1        0        0
#> 2     2        0        0
#> 3     3        1        0
#> 4     4        1        0
#> 5     5        0        1
#> 6     6        0        1

# ...or use `retain = TRUE` and `juice` to extract training data
dummy_recipe %>% 
    prep(retain = TRUE) %>% 
    juice()
#> # A tibble: 6 x 3
#>       y letter_b letter_c
#>           
#> 1     1        0        0
#> 2     2        0        0
#> 3     3        1        0
#> 4     4        1        0
#> 5     5        0        1
#> 6     6        0        1

Ricardo González-Gil · Answer 6 · 2012-08-03T09:44:27+00:00

Ricardo González-Gil

원본 비 AMP 버전 편집

일반적으로 이러한 종류의 더미 com/go/4e6b330a_kr 작동합니까 내가 할 수 있다.

(1) 에 대한 관찰, 즉 1957년 # 10 어떻게 작성합니까 가변수 (가치 = 1 (1957년, 제로 그렇지 않으면) *


data$factor_year_1

9

0

해설 (0)

Jaap · Answer 7 · 2018-02-13T18:38:52+00:00

Jaap

원본 비 AMP 버전 편집

미하이 에미네스쿠 (우스카스 대한 질문에 대한 논리적 찼음을 곱합니다 놈팽이한테 수도 있습니다 함께 '1' (또는 어쩌면 더 '와' 1L):


# example data
df1

Jaap

편집된 답변26일 8월 2019 в 11:06

8

0

해설 (0)

skpro19 · Answer 8 · 2015-05-16T10:37:32+00:00

skpro19

원본 비 AMP 버전 편집

내가 읽고 있는 이 카글 포럼:


#Generate example dataframe with character column
example

7

0

해설 (0)

Fernando Hoces De La Guardia · Answer 9 · 2015-03-27T17:45:07+00:00

Fernando Hoces De La Guardia

원본 비 AMP 버전 편집

대신 더미 com/go/4e6b330a_kr afaq 스케쳐내 ᄀ씨 K-1 으로 종료기:

dummies = table(1:length(year),as.factor(year))

베스트,

7

0

해설 (1)

Alex Thompson · Answer 10 · 2015-12-09T22:41:46+00:00

이 ',' 세페우스 https://stat.ethz.ch/R-manual/R-devel/library/base/html/ifelse.html";; a href = &quot &lt &gt &lt /a>; 가장 단순한 논리 함수를 이런 식이었다.

> x   [1] 1 1 1 1 1 1 1 1 0 0 0

또한 당신이 원한다면 반환되기를 문자 데이터 어졌다면 그렇게 할 수 있습니다.

> x   [1] "foo" "foo" "foo" "foo" "foo" "foo" "foo" "foo" "bar" "bar" "bar"

범주 com/go/4e6b330a_kr 함께 중첩하기.

> x   [1] "baz" "baz" "baz" "baz" "baz" "baz" "baz" "foo" "bar" "baz" "baz"

이것은 가장 쉽게 사용할 수 있습니다.

Sotos · Answer 11 · 2017-10-06T06:32:19+00:00

Sotos

원본 비 AMP 버전 편집

또 다른 방법은 '에서' 패키지 '를 사용하는 것이 마타불라트 크다pto올스 (예:

df

4

0

해설 (0)

Maciej Mozolewski · Answer 12 · 2015-08-18T09:50:00+00:00

내가 이런 기능을 사용하여 (backup-to-disk 데이타스터블):

# Ta funkcja dla obiektu data.table i zmiennej var.name typu factor tworzy dummy variables o nazwach "var.name: (level1)"
factorToDummy  new.names
  dtable[, (new.names) := transpose(lapply(get(var.name), FUN = function(x){x == levels(get(var.name))})) ]

  cat(paste("\nDodano zmienne dummy: ", paste0(new.names, collapse = ", ")))
}

사용법:


data

wordsforthewise · Answer 13 · 2018-02-15T03:48:46+00:00

wordsforthewise

원본 비 AMP 버전 편집

데이터를 데이타스터블 및 사용 및 행일 필터링부터 참조별로 설정되었습니다 변환할 수 있습니다


library(data.table)

dt

1

0

해설 (0)

Ronak Shah · Answer 14 · 2019-10-02T02:05:52+00:00

Ronak Shah

원본 비 AMP 버전 편집

우리는 '에서' cSplit_e 스플리트스타크샤피 '도 사용할 수 있다. # 39 의 데이터를 사용하여 @zx8754&.

df1

0

해설 (0)

Sophia J · Answer 15 · 2018-05-09T21:09:43+00:00

Sophia J

원본 비 AMP 버전 편집

또 다른 방법을 사용해야 할 수 있다.

ifelse(year < 1965 , 1, 0)

dee-see

편집된 답변9일 5월 2018 в 11:54

0

해설 (0)

kangkan Dc · Answer 16 · 2015-02-06T17:18:08+00:00

내가 이 글을 작성할 수 있는 일반 기능에서는 아아아안녀어엉 가변수 복제하므로 기능을 근본적으로 바꾸기 Stata.

만약 x 는 x 와 난 로렌아줌마가 더미 (dummy) 는 데이터 프레임을 'a' 라는 변수를 가치 있는 'b' 는 '1' 가치 'c' 가 앨리어스보다 때 x $


introducedummy

가변수 생성합니다.

39 m, 시계열 데이터 분석 i& 연간 (기간 1948-2009년). 나는 두 가지 질문을합니다.

10 대한 관찰, 즉 어떻게 작성합니까 가변수 (가치 = 1 (1957년) 는 1957년, 제로 그렇지 않으면)?

['캐릿 도미바르스'] (https://topepo.github.io/caret/pre-processing.html # 더미 com/go/4e6b330a_kr 만들기)

['recipes::step_dummy'] (https://topepo.github.io/recipes/reference/step_dummy.html)