Премахване на редове с всички или някои NA (липсващи стойности) в data.frame

Question

Още

Източник Не AMP-версия Редактиране на

Премахване на редове с всички или някои NA (липсващи стойности) в data.frame

Искам да премахна редовете в тази рамка от данни, които:

По-долу е примерната ми рамка от данни: а) съдържа NA във всички колони.

             gene hsap mmul mmus rnor cfam
1 ENSG00000208234    0   NA   NA   NA   NA
2 ENSG00000199674    0   2    2    2    2
3 ENSG00000221622    0   NA   NA   NA   NA
4 ENSG00000207604    0   NA   NA   1    2
5 ENSG00000207431    0   NA   NA   NA   NA
6 ENSG00000221312    0   1    2    3    2

В общи линии бих искал да получа рамка от данни, подобна на следната.

             gene hsap mmul mmus rnor cfam
2 ENSG00000199674    0   2    2    2    2
6 ENSG00000221312    0   1    2    3    2

б) съдържа NA само в някои колони, за да мога да получа и този резултат:

             gene hsap mmul mmus rnor cfam
2 ENSG00000199674    0   2    2    2    2
4 ENSG00000207604    0   NA   NA   1    2
6 ENSG00000221312    0   1    2    3    2

Jaap

Редактиран въпрос Направете август 2018 в 12:32

Програмиране

filter r dataframe missing-data r-faq

Направете февруари 2011 в 11:52

19 изгледи

Roman Luštrik

Източник Не AMP-версия Редактиране на

Опитайте с na.omit(your.data.frame). Що се отнася до втория въпрос, опитайте се да го публикувате като друг въпрос (за по-голяма яснота).

241

0

Коментари (3)

donshikin

Източник Не AMP-версия Редактиране на

Предпочитам следния начин за проверка дали редовете съдържат NA:


row.has.na

88

0

Коментари (2)

Joris Meys · Accepted Answer · 2011-02-01T12:21:42+00:00

Проверете също complete.cases :

> final[complete.cases(final), ]
             gene hsap mmul mmus rnor cfam
2 ENSG00000199674    0    2    2    2    2
6 ENSG00000221312    0    1    2    3    2

na.omit е по-хубав за просто премахване на всички NA's. complete.cases позволява частична селекция чрез включване само на определени колони от рамката с данни:

> final[complete.cases(final[ , 5:6]),]
             gene hsap mmul mmus rnor cfam
2 ENSG00000199674    0    2    2    2    2
4 ENSG00000207604    0   NA   NA    1    2
6 ENSG00000221312    0    1    2    3    2

Вашето решение не може да работи. Ако държите да използвате is.na, тогава трябва да направите нещо подобно:

> final[rowSums(is.na(final[ , 5:6])) == 0, ]
             gene hsap mmul mmus rnor cfam
2 ENSG00000199674    0    2    2    2    2
4 ENSG00000207604    0   NA   NA    1    2
6 ENSG00000221312    0    1    2    3    2

но използването на complete.cases е доста по-ясно, а и по-бързо.