(신뢰도 계수) = .** 라고 했을 때
가로 안의 신뢰도 계수 대신 상관계수라고 쓰면 의미가 틀려지는 건가요??
책에 보니 신뢰도는 신뢰도계수로 그정도를 표시하는데 이는 앞에서 제시한 세가지 방법에서 척도의 적용결과 점수의 상관계수로 표시한다.라고 나와있네요
(신뢰도 계수) = .** 라고 했을 때
가로 안의 신뢰도 계수 대신 상관계수라고 쓰면 의미가 틀려지는 건가요??
책에 보니 신뢰도는 신뢰도계수로 그정도를 표시하는데 이는 앞에서 제시한 세가지 방법에서 척도의 적용결과 점수의 상관계수로 표시한다.라고 나와있네요
의미가 틀려집니다.
신뢰도 계수는 아시리라 생각하고 상관계수에 관해 설명드리면....
일단 공분산에 관해 아셔야 합니다. 공분산(covariance)는 두 변수의가 상관관계를 가지는지 나타냅니다.
Cov[X,Y] =E(X-m(X))(Y-m(Y))] 로 정이되는대요
여기서 m(x)와 m(y)는 각각 변수 X 와 Y의 평균입니다.
자 여기서 X와 Y가 완전히 독립일때는 Cov[X,Y]=E[(X-m(X))(Y-m(Y))] = E(X-m(X))*E(Y-m(Y)) 가되어서
E[X-m(X)] = E(X) - m(X) = m(X) - m(X) = 0 가 되기 때문에 결국 Cov[X,Y]=0 가 됩니다.
반대로 두변수가 완전 일치 할때는 X=Y 가 되겠죠. 이때는 Cov[X,Y]=Cov[X,X]=E[(X-m(X))(X-m(X))]=Var(X) 가 됩니다.
두 변수가 완전히 반대로 움직일 때는 X=-Y 가 되겠죠. 이때는 Cov[X,Y]=Cov[X,-X]=-E[(X-m(X))(X-m(X))]=-Var(X) 가 됩니다.
그러니까 공분산 (Covariance)는 독립일때는 0 그리고 완전히 일치할 때나 완전히 반대 방향으로 일치 할때는
Var(X) 나 -Var(X) 가 됩니다.
하지만 이런 공분산은 변수의 단위에 따라 틀려지기 때문에 다른 변수들과 비교가 힙들게 됩니다.
예를 들어 공분산이 10이라고 할때 이게 상관관계가 높은지 낮은지 알기 힘듭니다.
만약 X 와 Y의 단위가 10단위 라면 상관관계가 높구요 만약 10000 단위라면 공분산 10은 매우 작은 상관관계를 나타냅니다
그래서 이런 문제를 해결하기 위해 표준화된 수치로 나온것이 상관계수 (Correlation Coefficient) 입니다.
이건 correlation coefficient (X,Y) = Cov[X,Y]/ (Var(X)^1/2 * Var(Y)^1/2) 으로 정의 됩니다.
바로 요게 공분산과 상관계수의 관계입니다.
두 변수가 독립일 경우는 Cov[X,Y]=0 이기 때문에 correlation coefficient(X,Y)=0 입니다.
두 변수가 완전히 일치할 경우 X=Y 이기 때문에 Cov[X,Y]=Cov[X,X]=Var[X] 이고
correlation coefficient (X,Y) = correlation coefficient (X,X) = Cov[X,X]/ (Var(X)^1/2 * Var(X)^1/2) = Var[X]/Var[X] =1 이 됩니다.
두 변수가 왼전히 반대로 움직일 경우 X=-Y는 같은 방법으로 correlation coefficient (X,Y)=-1 이 됩니다.
그래서 상관계수는 변수의 단위에 관계없이 항상 -1 과 1 사이에 값이 존재하구요
완전 독립이면 0, 상관관계가 높으면 1 이나 -1에 가까운 수치가 됩니다.