2020년 2월 19일 수요일

자료 변환, 변수 계산

자료변환, 변수계산 


1. SPSS 데이터 파일(확장자 .SAV)을 실행한 화면이다. 이 자료는 여기에서 다운로드한다.



2. 데이터 보기(Data View) 시트에 사용자가 직접 자료를 입력, 수정 및 삭제를 할 수 있다.



3. 변수 보기(Variable View) 시트에서 변수에 대하여
  • 이름은 변수명을 입력하는 것으로 변수명은 첫 번째 글자는 반드시 문자이어야 하고, 특수문자는 삽입할 수 없고(_, $ 제외), 숫자는 첫 글자는 제외하고 사용할 수 있다.
  • 유형은 변수의 데이터 타입을 설정하는 것으로 숫자, 문자, 날짜 등이 있다.
  • 너비데이터 보기의 각 변수에 값이 들어갈 데이터의 크기를 설정하는 것으로 한글은 한 문자를 2로 영어는 한 문자를 1로 여긴다.
  • 소수점이하자리는 원 자료에 대하여 보여지는 소숫점 자리수로 유효하지 않은 숫자는 0으로 표시한다.
  • 설명은 변수에 대하여 설명을 길게 할 수 있는 것으로 이름에 변수 이름을 설정하는 것과 다르게 제약없이 어떠한 문자도 입력이 가능하다. 통계분석 출력결과에 설명이 있으면 이름 값은 출력되지 않고 설명이 출력된다.
  • 이산형, 범주형 자료인 경우 데이터 보기에 숫자로 입력하고, 여기서 숫자에 대응하는 값에 대하여 설명을 삽입할 수 있다. 문자가 원 자료에 저장된 경우 일부 분석에서 제약사항이 있기 때문에 분석이 불가능하므로 이 기능을 사용하는 것을 권장한다.
  • 결측값 설정은 한 값, 또는 범위로 설정할 수 있다.
  • 데이터 보기에서 보여지는 열의 너비이다.
  • 맞춤은 정열의 방법을 설정한다. 기본적으로 문자는 왼쪽, 숫자는 오른쪽에 정열된다.
  • 측도은 자료의 형태가 척도형, 명목형, 순위형 중 선택한다. 


4. 변수계산

기존에 존재하는 변수들과 연산을 실행하여 새로운 변수 생성한다. 아래의 화면은 "변환(Transform) ->변수계산(Compute)" 메뉴를 선택하였다.
대상변수(Targer Variable)에 BMI, 숫자 표현식(Numeric Expression)에 bmi(body mass index, 체질량지수) = kg/m2를 변수와 제곱승 등을 이용하여 아래 그림과 같이 입력한다.






5. 생성된 변수를 테이터 보기(Data Variable) 시트에서 다음 그림과 확인할 수 있다.




6. 새로운 변수로 코딩변경

기존에 존재하는 변수를 몇 개의 범주로 나누어 새로운 변수를 생성하는 방법은 다음과 같이 두 가지가 있다.
  • 같은 변수로 코딩변경(Into Same Variables) : 기존에 존재하는 변수의 값이 변경하는 변수로 변함. 기존에 존재하는 변수값은 사라짐
  • 다른 변수로 코딩변경(Into Different Variables) : 기존에 존재하는 변수 값을 이용하여 새로운 변수값 생성
  1. "변환(Transform)->다른 변수로 코딩변경(Into Different Variables)" 메뉴를 선택한다.
  2. bmi 변수를 선택하고 버튼을 누르면 변경할 변수가 추가되고
  3. 출력변수(Output Variable)에 바뀔 이름을 입력한 후 "바꾸기(Change)" 버튼을 누른다.
  4. "기존값 및 새로운 값(Old and New Values)" 버튼을 누르면 기존에 존재하는 변수(bmi)에 여러 조건을 입력하여 새로운 변수를 생성할 수 있다.
조건을 주는 과정은 다음 화면에 있다.




7. 새로운 변수로 코딩변경

BMI 변수를 범위에 따라 6개 등급으로 나누는 과정이다. 이 화면에서 bmi 변수는
  • 최소값에서 18.5 는 1
  • 18.5 에서 23 은 2
  • 23 에서 25 는 3
  • 25 에서 30 은 4
  • 30 에서 35 는 5
  • 35 에서 최대값까지는 6
으로 변경하려고 한다. 등급으로 나누는 과정은
  1. "기존값(Old Value)->범위(Range)"를 선택
  2. "범위(Range)->최자값에서 다음 값까지 범위(Lowest through)" 입력창에 "18.5" 를 입력
  3. "새로운 값(New Value)->기준값(Value)"을 선택하고 1 을 입력
  4. "추가(Add)" 버튼을 누른다.
이고 각 범주에 대하여 동일한 과정을 거치면 연속형 자료를 범주형 자료로 변환하여 새로운 변수를 생성할 수 있다. 




8. 새로운 변수로 코딩변경 결과

기존에 존재하는 변수에서 새로운 변수로 자료를 생성한 결과이다.




9. 코딩변경

생성된 등급 변수는 1에서 6으로 분류하여 저장되었으며 이 값들은 각각
  • 1 은 저체중
  • 2 는 정상
  • 3 은 과체중
  • 4 는 1 단계 비만
  • 5 는 2 단계 비만
  • 6 은 3 단계 비만
으로 통계분석결과에서 출력되도록 설정하려면 다음 그림과 같다.



댓글 없음:

댓글 쓰기