중앙 경향 : 가까운 전망

중앙 경향 의미 :

경제 및 관리의 많은 문제는 빈도 분포와 관련이 있습니다. 빈도 분포에서 특정 값은 자주 발생하지만 다른 값은 덜 자주 발생합니다.

보다 구체적으로, 많은 주파수 분포에서, 표로 표시된 값은 분포의 시작과 끝에 작은 주파수를 나타내며 분포 중간에 더 높거나 높은 주파수를 나타냅니다.

이는 변수의 전형적인 값이 분포의 중심 부분에 더 가깝고 이러한 중심 값 주위의 다른 값 군집 또는 그룹에 있음을 나타냅니다. 분포의 중앙 부분에있는 값의 집중에 관한 데이터의 이러한 행동을 데이터의 중심 경향 (또는 위치)이라고합니다.

우리가 알고 있듯이 변수는 시간에 따라 변하는 (시계열 데이터라고 함) 또는 공간 (단면 데이터라고 함)에 따라 여러 관측 값을 갖습니다. 전체 관측 값을 훨씬 신중하고 집중적으로 살펴보면 이러한 값이 중앙 또는 거의 중앙 위치에있는 일반적인 값을 중심으로 모이는 일반적인 경향이 있음을 알 수 있습니다. 이렇게 식별 된 특정 값을 중심 값이라고하며 현상은 변수의 중심 경향으로 나타납니다. 계산 된 여러 유형의 평균은 주어진 변수의 경향에 대한 일반적인 척도입니다.

일반적으로 우리는 변수의 중심 경향의 세 가지 유형, 즉 주어진 변수의 사용 가능한 값의 평균, 중간 및 모드에 익숙합니다. 다시 말하지만, 평균은 산술 평균 (AM) 기하 평균 (GM)과 고조파 평균 (HM)의 세 가지 범주로 구성됩니다.

우리는 다음과 같이 표현할 수 있습니다.

특정 변형 범위 내에서 변수의 중심 경향 측정의 분류 :

우리는 일반적으로 다음과 같은 고안을 적용하여 주어진 변수가 여러 개의 개별 값으로 나타나는 경향을 정량화합니다.

중심 경향의 분류 :

(평균:

(i) 산술 평균

(ii) 기하 평균

(iii) 조화 평균

(b) 중앙값,

(c) 그룹화 (빈도) 및 그룹화되지 않은 (빈도) 데이터 모드.

요약 표기법 (∑) :

기호 ∑는 그리스어 대문자 시그마를 나타내는 합계입니다. 기호 X i (x 첨자 i를 읽음)는 변수 x에 의해 가정 된 값 X 1 X 2, X 3 … X n 중 어느 하나를 나타내도록하자. 숫자 1, 2… n 중 하나를 나타내는 문자를 첨자라고합니다.

평균:

변수 값 집합의 평균 또는 산술 평균은 주어진 변수의 모든 값의 합계를 숫자로 나눈 값입니다.

산술 평균은 일반적으로 두 가지 유형입니다.

(a) 간단한 산술 평균

(b) 가중 산술 평균.

간단한 AM :

중심 경향의 가장 일반적으로 사용되는 측정 값은 산술 평균입니다. 각 관측치의 숫자 값의 합계를 총 관측치 수로 나눈 값으로 정의됩니다. 즉, 관측치 세트의 항목 값을 더하고 총계를 항목 수 또는 관측치 수로 나누어 계산합니다.

산술 평균은 다음과 같이 상징적으로 정의됩니다.

식 (8.1)에서, x (판독 x 바)는 평균 또는 산술 평균이다.

변수에 주어진 모든 관측치의 대표 값입니다.

예 1 :

마을의 작은 산업 단위에서 일하는 10 명의 노동자의 평균 임금을 찾으십시오.

X : 88, 72, 33, 29, 70, 54, 86, 91, 57, 6

해결책:

이 10 명의 노동자의 임금의 총합은 다음과 같습니다.

식 (8.1) 또는 실시 예 1로부터 X 1, x 2 등이 주파수, 예를 들어 f 1, f 2 등으로 발생하면 AM이된다는 것이 명백하다

N = ∑f 인 경우 총 빈도 또는 총 관측치 수입니다.

예 2 :

시험에서 16 명의 학생의 성적이 55, 68, 36, 28 인 경우 각각 주파수 3, 2, 4, 6 및 1로 발생합니다. 계산 된 AM.

해결책:

산술 평균은 식 (8.2)에 기초하여 계산됩니다

예 3 :

Il-yr은 다음과 같은 마크를 획득했습니다. 한 수험생의 점수가 누락되어 이후에 포함되었으며 평균 계산 치는 3입니다. 마지막 수험생의 점수를 결정하십시오.

1, 1, 0, 2, 0, 3, 0, 4, 8, 6, 5.

해결책:

이 과정에 한 명의 추가 수험자가 포함되어 있기 때문에 총 수험자는 12 명이되었으며 총 점수는 12 x 3 = 36이어야합니다.

다시, 이전 11 명의 학생들이 얻은 점수의 합은 30이었습니다.

따라서 마지막 점수는

36 – 30 = 6.

가중 오전 :

산술 평균은 모든 항목 또는 관측치에 동일한 중요성을 부여합니다. 진실로 말해서, 그러한 모든 관찰은 동일한 중요성이나 무게를 끌어 내지 않을 수 있습니다. 일부 관측치는 다른 관측치에 비해 더 큰 가중치를받을 수 있습니다. 예를 들어, 일일 필요량 (예 : 음식)에 더 큰 가중치가 할당되고 가족 예산에서 명품에 더 적은 가중치가 부여됩니다.

우선 순위에 따라 그림 (또는 숫자)이있는 다른 항목에 첨부 된 이러한 중요성을 가중치라고합니다. 평균이 각각의 가중치로 표현 될 때, 가중치 AM을 얻는다. 이러한 종류의 평균은 다양한 경제 문제를 연구하는 데 자주 사용됩니다.

방정식 (8.2)과 (8.3)의 유사성을 주목하십시오. 따라서 식 (8.2)은 가중치 f 1, f 2 …… f n을 갖는 가중치 AM으로 간주 될 수 있습니다.

예 4 :

각각의 주파수가 12, 7, 6 및 9 인 4 개의 주어진 숫자 92, 125, 180 및 80의 가중 AM을 찾으십시오.

해결책:

고유 주파수를 가진 4 개의 주어진 숫자 중 가중 AM은 다음과 같이 표현 될 수 있습니다.

예 5 :

다음 임금 근로 그룹의 산술 평균을 계산하십시오.

두 그룹으로 구성된 복합 평균 :

각각의 산술 평균 x means 1 과 x̅ 2 와 함께 n 1 과 n 2 관측 값을 포함하는 두 개의 개별 그룹이 변수에 대해 주어지면, 두 그룹의 복합 평균은 다음 관계로부터 결정될 수 있습니다 :

여기서 x̅는 주어진 두 그룹에 대한 합성 또는 공통 평균을 나타냅니다.

예 6 :

두 부서의 다른 직원의 급여의 복합 평균을 계산하십시오.

표 : 8.3 : 복합 평균 계산

AM의 중요한 특성 :

(a) 주어진 관측치 세트의 합은 관측치 수와 AM의 곱과 같습니다.

AM의 장단점 :

이 분야 GU Yule의 유명한 통계 학자이자 저자에 따르면, 산술 평균은 만족스러운 평균입니다.

다음과 같은 장점이 있습니다.

(a) 쉽게 이해할 수있다.

(b) 쉽고 정확하게 계산할 수 있습니다.

(c) 대수 처리에 적합합니다.

(d) 샘플링 변동이 없다.

(e) 계산에는 주어진 변수의 모든 값이 포함됩니다.

(f) 엄격하게 정의 할 수 있습니다.

(g) 모든 상황에서 안전하게 사용 가능하고 표현 가능하다.

그러나 산술 평균에는 단점이 없습니다. 그들 중 일부는 다음과 같습니다.

(a) 주어진 관측치 세트의 산술 평균은 관측치를 통해서만 식별 할 수 없습니다.

(b) 주어진 데이터 세트에서 단일 관측치가 누락되거나 거부 된 경우 올바르게 계산할 수 없습니다.

(c) 주어진 변수에 대한 전체 관측치가 한 번에 제공되지 않으면 정확하게 계산 될 수 없습니다.

(d) 산술 평균은 더 큰 항목에 더 큰 중요성을 부여하는 반면 작은 항목은 더 적은주의를받습니다.

(e) 위치 평균이 아니라는 점을 명심해야한다. 수학적 계산 만 필요합니다.

(f) 마지막으로, 간단한 산술 평균은 숫자로만 표시되고 다른 것은 없습니다.

그러나 산술 평균은 일반적인 유형의 기본 통계 도구이며 다양한 통계 분석에 널리 사용됩니다. 오늘날이 변수는 변수의 중심 경향을 나타내는 매우 보편적 인 표현으로 사용되므로 여러 분석 목적으로 자주 사용됩니다.

GM의 의미 :

AM과 같은 기하 평균도 계산 된 평균입니다. 그러나, 한정된 수의 관측치를 갖는 변수의 중심 경향을 식별하는 것은 또 다른 종류의 통계 장치이다. 더 정확하게는 일련의 n- 관측에 대해 제품의 n 번째 근으로 결정됩니다.

다음과 같은 변수 (x)의 관측에 대한 GM

n- 양수 X 1, X 2 … .. 집합의 GM (변수 x와 함께 n- 관측에 대한) ..... X n 은 해당 수의 곱의 n 번째 근입니다

앞에서 설명한 것처럼 관측 수가 3 개를 초과하면 계산이 매우 어려워지고 지루하다는 점을 명심해야합니다. 이러한 종류의 문제를 고려하여 로그를 사용하는 것이 좋습니다. 다시 말하면, 관측치 수가 충분히 클 때 계산을 단순화하기 위해 로그가 사용됩니다. GM을 계산하기 위해 자주 사용합니다

X1 X2… .Xn이 각각 주파수 (또는 가중치) f 1, f 2 … f n 에서 발생하면 GM은 다음과 같이 주어집니다.

GM의 장단점 :

산술 평균과 같은 기하 평균은 많은 장점과 단점이 있습니다.

아래 순서대로 제공됩니다.

(a) 엄격하게 정의 할 수 있습니다

(b) 변수의 모든 관측치에 기초하여 계산됩니다.

(c) GM의 도움으로 필요한 비율, 비율 및 백분율의 평균을 계산하는 것이 훨씬 편리합니다.

(d) 예외적이고 극도로 크거나 작은 변수 값의 영향을받지 않습니다.

(e) 가장 낮은 관측치에 대해 가장 높은 가중치를 부여하고 가장 높은 관측치에 대해 가장 낮은 가중치를 부여함으로써 전체 결과의 균형을 유지하여 최상의 결과를 얻습니다.

(f) 나중에 다른 수학적 치료에 사용하기에 매우 적합합니다.

(g) 여러 국가의 통화 간의 환율을 결정하는 데 도움이됩니다.

단점은 다음과 같습니다.

에이. 데이터가 충분한 수의 큰 주파수를 갖는 그룹화 된 주파수 분포의 방식으로 제공 될 때를 계산하는 것은 매우 어렵다.

비. 정보가 0이거나 음수이면 결과는 의미가 없습니다.

씨. 최종적으로 얻은 결과는 시리즈에 제공된 관측치와 같지 않을 수 있습니다.

디. 한계와 극단적 인 관찰에는 가장 중요하지 않습니다.

이자형. 어떤 경우에는 평균의 진정한 대표자 역할을 할 수 없습니다.

에프. 일반적으로 변화의 차이가 아닌 변화의 비율의 특성을 나타냅니다.

GM의 계산 :

예 1 :

가중치가 각각 5, 3, 2 및 8 인 변수의 관측치 12, 18, 48 및 61의 GM을 찾습니다.

해결책:

GM을 계산하기 위해 테이블 ​​형태로 데이터를 준비합시다.

예 2 :

세 숫자의 GM은 15이고 숫자는 5.25와 x입니다. x-의 값을 찾으십시오.

해결책:

우리는 세 개의 숫자에 대해

GM의 중요한 특성 :

(a) 주어진 변수에 대한 관측치의 크기가 크면 기하 평균은 공통 값과 같습니다.

상징적으로 다음과 같이 씁니다.

X G = (C n) 1 / n = C

여기에서 주어진 변수 x는 개별적으로 C와 동일한 n 개의 관측치를 취합니다.

(b) 변수 값 집합의 기하 평균의 로그는 해당 로그의 산술 평균입니다.

(c) y가 y = ax 형식의 변수 x의 함수 인 경우 y의 기하 평균은 유사한 형식으로 x의 기수 평균과 관련됩니다. 즉 y G = ax G, 여기서 y G 및 X G 는 기하 각각 y와 X의 수단

(d) 두 변수 비율의 기하 평균은 다음과 같은 기하 평균의 비율입니다.

(e) n 1 과 n 2 관측치로 구성된 변수 X의 두 세트의 값이 있고 G이고 G2가 각각의 기하 평균 인 경우 조합 된 세트의 기하 평균은 다음과 같이 주어집니다.

고조파 평균의 의미 :

변수에 대한 관측치 세트의 고조파 평균은 주어진 관측치의 역수의 산술 평균의 역수로 정의됩니다 (모든 관측치가 0이 아니어야 함).

언급 된 변수가 X 인 경우 x- 1, x 2, x 3, … x n으로 n 개의 숫자를 취하며 그 역수는

각각의 주파수를 갖는 관측치에 대해 가중 HM은 다음과 같이 계산 될 수 있습니다.

일부 선택된 상황에서 사용되는 특별한 종류의 평균입니다.

HM의 중요한 특성 :

(a) 변수의 주어진 값이 모두 같지만 (그러나 ≠ 0) 그들의 조화 평균은 공통 값과 같습니다.

여기서 n은 변수의 총 관측치 수이고 c는 공통 값입니다.

(b) 변수 y가 y = ax 형식의 다른 변수 X와 관련된 경우 y의 고조파 평균은 비슷한 형식의 x의 고조파 평균과 관련이 있습니다.

(c) n 1 과 n 2 가 변수 x의 두 값 세트이고 각각의 고조파 평균이 H 1 과 H 2 인 경우 조합 된 세트 (H)의 고조파 평균은 다음과 같이 주어집니다.

HM의 계산 :

예 1 :

숫자 3, 6, 24 및 48의 단순 고조파 평균을 계산하십시오.

해결책:

HM의 원칙을 적용하면 다음과 같은 이점이 있습니다.

예 2 :

변수 X의 관측치에 대한 가중 HM을 다음에서 결정합니다.

HM의 장단점 :

앞서 언급 한 중심 경향의 모든 장치와 마찬가지로 고조파 평균에는 여러 가지 장점과 단점이 있습니다.

이것들은:

고조파 평균의 장점 :

(a) 그것은 매우 명확하고 엄격하게 정의된다

(b) 변수에서 사용 가능한 모든 정보를 기반으로 계산됩니다.

(c) 다양한 수학적 분석에 사용하기에 매우 적합합니다.

(d) 샘플링 변동으로 인해 거의 영향을받지 않습니다.

(e) 쉽게 계산할 수 있으므로 본질적으로 정확합니다.

(f) 항상 명확한 가치를 가진다.

(g) 중요성이 더 크거나 그 반대 인 관찰이 작은 것을 고려한다.

(h) 주어진 변수의 관측치에서 상대적인 변화를 측정 할 때 특정 비율과 비율의 평균을 찾는 데 완벽하게 유용합니다.

고조파 평균의 단점 :

(a) 일반적으로 발견 된 결과는 변수에 대해 주어진 일련의 관측치에 존재하지 않습니다.

(b) 쉽게 설명하고 계산할 수 없으며 따라서 이해할 수 없다.

(c) 관측치 중 하나가 0이면 계산할 수 없다는 점에서 매우 제한적이다.

(d) 실제 상황에서는 적용이 제한되어있다.

AM, GM 및 HM의 상호 관계 :

관측치 x 1 과 x 2 (예 : 동전의 양면) 만있는 변수 X에 대한 가장 간단한 예를 살펴 보겠습니다.

변수에 대한 여러 관측치에 대해 동일한 분석을 확장 할 수 있으며 동일한 결과를 쉽게 설정할 수 있습니다.

다른 중요한 관계는 다음과 같습니다.

2. 변수에 대한 모든 관측치의 크기가 동일한 경우 AM = GM = HM.

이종 관찰의 경우 AM> GM> HM

상징적으로, 우리는 그것들을

오전> GM> HM

그러나 두 가지 숫자의 관계는 다음과 같이 바뀝니다.

AM x HM = (GM) 2

변수가 동일한 관측치를 가정 할 때 모든 평균이 서로 같아집니다.

중앙값:

변수에 대한 일련의 관측치의 중앙값은 주어진 관측치의 중앙값으로 식별됩니다. 오름차순 또는 내림차순으로 정렬 된 그룹화되지 않은 데이터 세트의 경우, 가장 중간 값 또는 중앙값이 홀수의 관측치에 대한 (N + 1 / 2) 번째 값으로 계산됩니다. 그러나 짝수의 관측치의 경우 중앙값은 해당 관측치의 (N / 2) 및 (N + 1 / 2) 값의 평균이됩니다.

따라서 중앙값이 전체 계열을 두 개의 동일한 부분으로 나누는 것이 분명합니다. 위치 평균이며 매우 크거나 작은 값의 영향을받지 않습니다. 또한 개방형 클래스가있는 그룹화 된 주파수 분포에서 계산할 수도 있습니다.

예 1 :

Rs의 중앙값을 구하십시오. 110, Rs. 90, Rs. 40, Rs. 50, Rs. 125, Rs. 65 및 Rs. 100.

해결책:

주어진 값을 오름차순으로 정렬하여 시퀀스를 Rs로 얻습니다. 40, Rs. 50, Rs. 65, Rs. 90, Rs. 100, Rs. 110 및 Rs. 125. 따라서, n = 7이다. 7은 홀수이기 때문에. 중간에 하나의 값만 있습니다.

– 즉,

네 번째 값. 4 번째 밸브 = Rs입니다. 따라서 정의상 중간 값은 Rs이다. 90.

예 2 :

25, 24. 23, 32, 40, 27, 30, 25, 20, 10, 15, 45의 중앙값을 구하십시오.

해결책:

주어진 값을 오름차순으로 정렬하면 시퀀스가 ​​10, 15, 20, 23, 24, 25, 25. 27, 30, 32. 40 및 45로 나타납니다.

따라서, n = 12는 숫자 12가 짝수이므로 6 번째 및 7 번째 항, 즉 25 및 25의 2 개의 중간 항을 갖는다.

따라서 정의에 의한 중앙값

이러한 중간 값 계산은 주파수 분포를 고려하지 않습니다. 따라서 중앙값의 계산은 그러한 시리즈에 대한 단순한 것입니다.

대신 그룹화되지 않은 데이터와 그룹화 된 데이터에 대한 중앙값을 계산하려고합니다. 그룹화되지 않은 데이터를 먼저 고려해 봅시다. 이 경우 먼저 변수의 각 값에 해당하는 누적 빈도를 계산합니다. 그런 다음 (n + 1 / 2) 누적 주파수에 해당하는 변수의 값은 중앙값이며, 여기서 n = ∑f = 총 주파수입니다.

예제 3을 기준으로 그룹화되지 않은 데이터의 누적 빈도를 계산합니다 (표 8.5).

예 3 :

다음 데이터에서 중앙값을 찾으십시오.

해결책:

누적 빈도 계산 방법은 표 8.5에 나와 있습니다.

예 4 :

한 공장에서 400 명의 근로자 그룹에 대한 다음 소득 분배를 고려하십시오. 중간 소득을 결정하십시오.

해결책:

데이터의 간격이 서로 다르고 양쪽 끝이 열려 있습니다.

위의 표에서 Rs 사이의 중앙값이 발생해야합니다. 109.5 및 Rs. N / 2 = 200 인 139.5는 표에 표시된대로 196과 336 사이에서 발생합니다. 따라서 중앙값 = Rs입니다. 109.5 + 클래스 간격의 일부 (109.5-139.5). 이 분수는 간단한 보간으로 찾을 수 있습니다.

다음과 같이 진행합니다.

196에서 336 사이의 빈도 차이는 Rs의 소득 차이에 해당합니다. 109.5에서 Rs. 즉, 주파수 차이 140에 대응하는 139.5는 Rs의 차이가있다. 수입 30.

따라서 주파수의 단위 차이에 따라 수입의 Rs.30 / 140 차이가 발생합니다.

그러나 중앙값을 찾기 위해 누적 빈도 200까지, 즉 200 – 196 = 4의 차이로 진행하려고합니다.

따라서, 주파수의 4의 차이에 대응하여 Rs의 차이가있을 것이다. 수입 30/140 x 4 여기에 Rs. 30 / 140x 4 = Rs. 0.85는 더할 분수입니다. 따라서 중앙값 Rs. (109.5 + 0.85) = Rs. 110.35.

상기 예에서, 개방 단부를 갖는 주파수 분포로부터 중앙값을 계산할 때 중간 값이 개방 x- 클래스에 속하지 않는 한 어려움이 발생하지 않음이 명백하다. 또한 그룹 분포의 중앙값을 구할 때는 클래스 제한이 아닌 클래스 경계를 ​​사용해야합니다.

위의 예제에서 중간 값을 보간 할 때 테이블의 맨 위에서 시작했지만 테이블의 맨 아래에서 시작하여 동일한 결과를 얻을 수있었습니다. 때때로, 중앙값은 (n + 1 / 2)와 동일한 누적 주파수에 해당하며, 여기서 n은 총 주파수입니다.

홀수의 관측치가있는 그룹화되지 않은 원시 데이터의 경우에도 마찬가지입니다. 그러나 그룹화 된 주파수 분포의 경우이 절차를 피해야합니다. 그렇지 않으면 테이블 상단부터 시작하여 보간으로 얻은 값이 하단부터 시작하여 얻은 값과 다릅니다. 평균을 고유하게 정의해야하므로 바람직하지 않습니다.

주파수 분포에서 평균값을 구하든 중간 값을 구하든, 얻은 값은 원시 데이터에서 얻은 값과 같지 않을 것입니다. 주파수 분포를 만드는 동안 우리의 목표는 데이터를 응축하는 것이며, 이 응축의 결과로 인해 일부 정보가 손실되기 때문에 이는 자연스러운 현상입니다.

예 5 :

(i) 유형보다 작거나 (ii) 유형보다 큰 누적 빈도 곡선을 사용하여 다음 데이터를 나타내고 통계에서 100 명의 학생들이 얻은 점수의 중간 값을 결정합니다.

통계에서 100 명의 학생들이 획득 한 점수의 빈도 분포 :

이제 2 차원 상자 다이어그램에서 수평으로 얻은 누적 주파수 (두 유형의)와 수직으로 해당 마크를 플로팅하고 아래 표시된 것처럼 필요한 누적 주파수 곡선 2 개를 쉽게 추적 할 수 있습니다.

두 누적 빈도 곡선 (i 및 ii)은 100 명의 학생들이 얻은 주어진 점수 ((i) 아래 및 (ii))에서 얻은 것입니다.

우리는 이제 점 E에서 교차하는이 두 곡선을 발견하고 그로부터 100 명의 학생들이 얻은 점수의 중간 값을 (39.5 + 02.5) = 42.0 (OA = 42)로 얻습니다.

중앙값의 장점과 단점 :

어떤 경우에는 중앙값이 산술 평균보다 충분한 이점을 갖습니다. 관측치 세트에 큰 값 또는 작은 값이 포함 된 경우 산술 평균이 올바른 측정 값을 제공하지 않을 수 있습니다. 우리는 인도의 1 인당 소득이 미국인의 1 인당 소득에 비해 너무 낮다는 것을 알고 있습니다. 부자와 인도의 가난한 사람들의 1 인당 소득에 대해서도 마찬가지입니다.

부자와 가난한 사람들 사이에 소득에 큰 격차가 있습니다. 빈곤층의 소득이 증가하지 않고 부유층의 소득이 크게 증가 할 경우 인도의 1 인당 소득은 증가합니다. 그러나 이러한 높은 소득 당 소득을 진정한 대표 소득이라고 할 수는 없습니다. 이러한 상황에서 소득의 중간 값은 1 인당 소득을 더 잘 대표 할 수 있습니다.

중간 값에는 다음과 같은 장점과 단점이 있습니다.

공적:

(a) 이해, 설명 및 계산이 간단합니다.

(b) 엄격하게 정의되어있다.

(c) 개방형 분포에 대해 계산할 수 있습니다.

(d) 관측의 규모보다는 관측의 수에 영향을 받는다.

(e) 극단적 인 가치에는 영향을받지 않습니다.

단점 :

(a) 시리즈의 모든 항목을 기반으로하는 것은 아닙니다.

(b) 추가 대수 치료에는 적합하지 않습니다.

(c) 위치 평균 일 뿐이므로 모든 값을 기준으로하지는 않습니다.

(d) 산술 평균에 비해 샘플링 변동의 영향을 많이받습니다.

방법:

변수의 중심 경향을 측정하는 또 다른 효과적인 통계 도구입니다. 불연속 변수에 대한 일련의 관측치의 경우 가장 높은 빈도를 갖는 특정 변수를 모드라고합니다. 숫자 집합의 모드는 가장 큰 빈도로 평판이 좋으며 그 의미에서 가장 일반적인 값입니다.

간단하게하기 위해 다음 그림을 고려하십시오.

3, 5, 8, 5, 4, 6, 5, 9, 5

이 숫자의 모드는이 숫자의 시리즈에서 가장 높은 시간 (4 회)으로 표시되었으므로 5입니다.

그러나, 특정 수의 반복을 갖지 않는 시리즈에 대해서는 어떠한 모드도 존재하지 않을 수 있으며, 일부 다른 시리즈에 대해서는 바이 모달 또는 트라이 모달 시리즈 라 불리는 둘 이상의 모드 값이 존재할 수도있다. 대부분의 경우, 일련의 숫자 (또는 주파수)에서 단일 모드를 찾고이를 단일 주파수 분포라고합니다.

실제로는 변수가 연속 변수에 비해 불연속적일 때 변수의 모드 값을 결정하는 것이 더 쉽습니다. 연속 변수의 경우 모드 값은 주파수 곡선의 피크 점 값과 밀접한 관련이 있습니다. 따라서 이러한 종류의 변수에 대해 주요 작업은 주어진 데이터에서 주파수 곡선을 도출 한 다음 곡선의 피크 점에 해당하는 최고 값을 식별하는 것입니다.

그러나 여러 상황에서 다음 공식을 사용하여 빈도 곡선을 추적하지 않고 변수의 모달 값을 결정할 수 있습니다.

변수의 모드 값을 계산하는 일반적인 두 가지 방법이 있습니다.

1. 주파수 곡선을 그려서

2. 처방 된 공식을 사용합니다.

표 8.9에 도시 된 바와 같이, 그룹화 된 주파수 분포로부터의 모드 값에 대한 계산 방법이 이하에서 설명 될 수있다 :

예:

해결책:

테이블을 자세히 관찰하십시오. 가장 높은 빈도는 34이며 클래스 경계가 27.5-32.5 인 클래스 간격 28-32 내에서 발생합니다.

이제 다음과 같은 값을 쉽게 감지 할 수 있습니다.

L 0 = 27.5, f 0 = 34, f -1 = 24, f 1 = 28로 바꾸고 다음 식을 입력하십시오.

따라서 필요한 모드 값은 30.62입니다. 다른 경우에, 클래스 간격이 동일하지 않은 경우, 평균과 중간 값이 이미 결정된 경우 평균-모드 = 3 (평균-중앙)으로 설정된 Karl-Pearson의 공통 관계를 통해 분포 모드를 결정할 수 있습니다.

모드의 장단점 :

모드는 제공된 데이터가 본질적으로 질적 일 경우 중심 경향의 유용한 척도입니다. 모드는 최대 집중력을 갖는 값이므로 몇 가지 뚜렷한 장점이 있습니다.

장점 :

(a) 모드의 개념은 이해하기 쉽다.

(b) 주어진 변수의 극한값에 영향을받지 않습니다.

(c) 종종 간단한 주파수 분포로부터 검사에 의해서만 결정된다. 비즈니스에서 매우 자주 사용됩니다.

(d) 또한 개방형 등급을 가진 그룹화 된 주파수 분포로부터 계산할 수있다.

단점 :

그러나 중심 경향의 척도 인이 모드에는 단점이 없습니다.

이것들은:

(a) 모든 경우에 잘 정의 된 모드를 찾는 것이 다소 어렵습니다.

(b) 주어진 변수의 모든 값에 기초한 것은 아닙니다.

(c) 추가 대수 치료에 매우 쉽고 쉽게 적합하지 않습니다.

(d) 샘플링 변동에 의해 크게 영향을 받는다.

좋은 통계 평균의 필수 특성 :

1. 쉽게 이해하고 계산해야합니다. AM은 GM 또는 HM과 비교하여 쉽게 계산할 수 있습니다. 또한, 모드뿐만 아니라 중앙값도 계산이 단순하다.

2. 좋은 평균을 엄격하게 정의해야합니다. 즉, 계산 된 중앙값 또는 평균값은 고유해야합니다. 그렇지 않으면 통계학자가 평균을 계산할 때 재량에 따라 몇 가지 오류가 발생할 수 있습니다.

3. 모든 관찰에 근거해야한다. 예를 들어 AM 만 모든 관측치에 따라 다릅니다. 중앙값과 모드에는이 속성이 없습니다.

4. 추가 통계 계산에 사용될 수 있다는 의미에서 대수 처리가 가능해야합니다.

5. 샘플링 변동에 크게 영향을받지 않아야합니다.

6. 변수의 극단적 인 값에 영향을받지 않아야합니다. 중앙값과 모드는 극단적 인 값의 영향을받지 않지만 AM은 크고 작은 극단적 인 값의 영향을 크게받습니다.

따라서 이상적인 평균 측정 값은 여러 경우에 찾기가 매우 어렵습니다.

평균, 중간 및 모드 간의 관계 :

변수에 주어진 관측치 세트의 빈도 분포는 두 가지 유형입니다. 하나는 평균, 중간 및 모드가 서로 일치하는 대칭 또는 정규 분포라고하며 다른 하나는 평균, 중간 및 중간의 비대칭입니다. 비대칭 분포라고하는 모드의 크기가 다릅니다.

이러한 치우친 분포에서는 다음과 같이 고유 한 관계를 유지한다는 것이 관찰되고 확립되었습니다.

평균 – 모드 = 3 (평균 – 중간),

Karl-Pearson의 관계라고 불렀습니다.

여기서 우리는 다른 두 값이 이미 알려진 경우 하나의 값을 쉽게 찾을 수 있습니다. 그러나이 관계는 단조롭고 약간 치우친 분포에만 안전하게 적용 할 수 있습니다.

다시 말하지만, 우리는 평균과 중앙값이 모두 올바른 정의와 안정성의 조건을 만족하지만 수치 계산과 관련하여 중앙값이 평균보다 계산하기 쉽다는 것을 알았습니다. 반대로 샘플링의 일반적인 변동은 평균보다 평균에 더 큰 영향을 미치지 만 특정 예외도 있습니다.

변수의 중심 경향을 측정하기위한 이러한 장치의 대수 처리와 관련하여 평균이 확실히 더 좋습니다. 하나의 특정 공통 측면과 관련된 여러 시리즈가 하나로 결합 된 상황에서 다양한 시리즈의 개별 평균과 관측 수에서 결합 된 평균을 찾을 수 있습니다. 그러나 중앙값의 경우 절대 불가능합니다.

변수에 대한 주어진 관측치의 경우, 중앙값은 물론 평균보다 특정 이점이 있습니다. 변수가 올바르게 배열 된 경우에만 변수에 대한 전체 관측 값 세트가 없어도 쉽게 계산할 수 있고 쉽게 얻을 수 있습니다.

게다가, 어떤 특별한 상황에서, 극단적 인 계급 간격이 지정되지 않은 (즉, 무한한) 상태에서 평균을 계산할 수는 없지만 이들로부터 중간 값을 쉽게 얻을 수 있습니다. 실제로, 대부분의 경우, 중앙값은 변수의 극한 항목의 영향을받지 않기 때문에 변수에 대한 관측치의 중심 경향을 나타내는 이상적인 대표로 보일 수 있습니다.

또한 평균은 피할 수없는 샘플링 변동으로 인해 평균에 반드시 영향을 미치며, 그 의미에서 중앙값은 평균보다 변수에 대해 주어진 관측치를 나타내는 더 자연스러운 평균으로 인식된다는 데 동의합니다.

위의 논의에서, 우리는 모든 상황에서 변수에 대한 주어진 관측치에 대한 중심 경향의 세 가지 측정 가능한 방법 중에서 가장 좋은 것을 선택하는 것이 현명하지 않다는 것을 안전하게 결론 낼 수 있습니다. 실제로, 주어진 데이터의 성질과 질 및 연구의 목적에 따라, 사용자 또는 연구자 및 연구원은 자신의 목적에 맞는 가장 적합한 또는 이상적인 것을 선택하는 것이 중요한 작업이다.

이러한 맥락에서 수학자와 통계학자는 '평균'을 다른 두 가지보다 많은 경우에 수용 할 수있는 이상적인 것으로 규정한다. 특히, 조사관이 관련 모집단으로부터 주어진 샘플이 제공된 특정 측면에 대해 결론을 내릴 때, 그 평균은 의심 할 여지없이 선택하고 사용하는 것이 가장 좋습니다.

 

귀하의 코멘트를 남겨