모집단과 샘플의 차이점은 무엇인가요?

Question

Baltimark

원본 비 AMP 버전 편집

모집단과 샘플의 차이점은 무엇인가요?

모집단과 표본의 차이점은 무엇인가요? 각각에 사용되는 공통 변수와 통계에는 어떤 것이 있으며 서로 어떤 관계가 있나요?

기계 학습 및 데이터 분석

population variance sample standard-deviation

20일 7월 2010 в 11:07

16 파운드

질문에 대한 의견 (1)

Vivi

원본 비 AMP 버전 편집

모집단은 관심 있는 값의 전체 집합 또는 개인입니다. 샘플은 모집단의 하위 집합으로, 추정에서 실제로 사용하는 값의 집합입니다.

예를 들어, 중국 거주자의 평균 신장을 알고 싶다면 모집단, 즉 중국 인구가 표본이 됩니다. 문제는 이 숫자가 상당히 많기 때문에 모든 사람에 대한 데이터를 얻을 수 없다는 것입니다. 따라서 샘플, 즉 관찰된 일부 또는 중국 내 일부 사람들의 키(인구의 하위 집합인 샘플)를 추출하고 이를 기반으로 추론을 수행합니다.

13

0

해설 (3)

Neil McGuigan

원본 비 AMP 버전 편집

인구는 연구 그룹의 모든 것입니다. 예를 들어, 애플의 주가를 연구하는 경우 과거, 현재, 심지어 미래의 모든 주가를 연구하는 것입니다. 또는 달걀 공장을 운영하는 경우 공장에서 생산된 모든 달걀이 연구 대상입니다.

항상 표본을 추출하고 통계 테스트를 수행할 필요는 없습니다. 직계 가족이 모집단이라면 모집단이 작기 때문에 표본을 추출할 필요가 없습니다.

샘플링은 다양한 이유로 널리 사용됩니다:

인구 조사(전체 인구 표본 추출)보다 비용이 저렴합니다.
미래 데이터에 액세스할 수 없으므로 과거 데이터를 샘플링해야 한다.
일부 품목을 테스트하여 폐기해야 하는데 모든 품목을 폐기하고 싶지 않은 경우(예: 계란)

8

0

해설 (0)

roseleneramas

원본 비 AMP 버전 편집

용어 "인구" 우리 보통 사람들의 생각하노라 생각하면 우리 마을에, 지역, 성별, 나이, 결혼 여부 및 해당 주 또는 국가, 민족, 종교 등의 특징을 맴버십을 등. 통계학에서 약간 다른 용어 "인구" 는 에서 유래했다. "인구" 에서 정의된 그룹 멤버가 모두 포함되어 있는 통계 정보 수집 또는 데이터 중심 决策 우리가 대해 검토하고 있다.

일부 부품설치 호출됨 샘플. 이는 인구 비율은 슬라이스에 it 부품 및 그 모든 것이 특징. 샘플 () 는 동일한 특성을 가지고 있는데 이 경우 실제로 과학적으로 그룹화할 그린 그린 부품설치 - 임의로. (여기에는 당신꺼에요 믿기 어려운 것이 사실!)

그린 있어야 샘플링합니다 임의로 두 가지 특징이 있습니다.

모든 사람이 동등한 기회를 단축시킵니다 샘플링합니다 선택할 수 있다. 그리고,
다른 사람이 한 사람을 선택물의 선택물을 무관합니다.

인구의 일반화할 수 있다는 것이 큰 무순서 샘플링합니다 지정하십시오. 대한 관심이 모아지고 있다. 네가 만일 커뮤니티에서 일반화할 수 있는 샘플 500 가구, 이곳에 살고 50,000 가구 수 있습니다. 해당되어서는 경우 일부 형성에 매우 비슷한 특성을 가진 이들은 500 50,000 것을 볼 수 있습니다.

2

0

해설 (1)

user91513

원본 비 AMP 버전 편집

인구는 모든 요소를 포함한 데이터 집합. 하나 이상의 부품설치 에서 샘플 구성되어 있었다. 보아, A. (2012년, 17)

0

해설 (1)

Graham Cookson · Accepted Answer · 2010-07-21T14:00:03+00:00

모집단은 연구 대상 엔티티의 집합입니다. 예를 들어 남성의 평균 키가 있습니다. 이것은 과거에 살았고, 현재 살아 있으며, 앞으로 살아갈 모든 남성을 포함하므로 가상의 모집단입니다. 이 예가 마음에 드는 이유는 분석가로서 연구하고자 하는 모집단을 선택해야 한다는 점을 강조하기 때문입니다. 일반적으로 모든 구성원을 관찰할 수 있는 것은 아니기 때문에(예: 미래에 존재할 남성) 전체 인구를 조사/측정하는 것은 불가능합니다. 전체 모집단을 열거하는 것이 가능하다고 해도 비용이 많이 들고 시간이 많이 걸리는 경우가 많습니다. 위의 예에서는 모집단 '남성'과 관심 있는 매개 변수인 키가 있습니다.

대신 샘플이라고 하는 이 모집단의 하위 집합을 취하고 이 샘플을 사용하여 몇 가지 조건이 주어지면 연구 대상 모집단에 대한 추론을 도출할 수 있습니다. 따라서 통계라고 하는 모집단 표본에서 남성의 평균 키를 측정하고 이를 사용하여 모집단에서 관심 있는 매개 변수에 대한 추론을 도출할 수 있습니다. 표본을 기반으로 모집단에 대한 결론을 도출하는 데에는 약간의 불확실성과 부정확성이 수반되기 때문에 추론입니다. 표본에 포함된 구성원이 모집단보다 적기 때문에 일부 정보가 손실될 수 있습니다.

표본을 선택하는 방법에는 여러 가지가 있으며 이에 대한 연구를 표본 추출 이론이라고 합니다. 일반적으로 사용되는 방법은 단순 무작위 샘플링(SRS)이라고 합니다. SRS에서는 모집단의 각 구성원이 표본에 포함될 확률이 동일하므로 '무작위'라는 용어가 사용됩니다. 이 외에도 층화 샘플링, 클러스터 샘플링 등 다양한 샘플링 방법이 있으며 각 방법마다 장단점이 있습니다.

모집단에서 추출하는 표본은 수많은 잠재적 표본 중 하나에 불과하다는 점을 기억하는 것이 중요합니다. 10명의 연구자가 모두 동일한 모집단을 연구하면서 각자의 샘플을 추출한다면 서로 다른 답을 얻을 수 있습니다. 앞의 예로 돌아가서, 10명의 연구자가 각각 다른 남성의 평균 키를 제시할 수 있습니다. 즉, 문제의 통계(평균 키)는 표본마다 다르며, 표본 분포라고 하는 분포를 갖습니다. 이 분포를 사용하여 모집단 매개변수 추정치의 불확실성을 이해할 수 있습니다.

표본 평균의 샘플링 분포는 표본 표준 편차를 표본 크기로 나눈 값과 같은 표준 편차를 갖는 정규 분포로 알려져 있습니다. 이는 표본의 표준 편차와 혼동하기 쉽기 때문에 표본 분포의 표준 편차를 표준 오차라고 부르는 것이 더 일반적입니다.