자료변환, 변수계산
3. 변수 보기(Variable View) 시트에서 변수에 대하여
- 이름은 변수명을 입력하는 것으로 변수명은 첫 번째 글자는 반드시 문자이어야 하고, 특수문자는 삽입할 수 없고(_, $ 제외), 숫자는 첫 글자는 제외하고 사용할 수 있다.
- 유형은 변수의 데이터 타입을 설정하는 것으로 숫자, 문자, 날짜 등이 있다.
- 너비는 데이터 보기의 각 변수에 값이 들어갈 데이터의 크기를 설정하는 것으로 한글은 한 문자를 2로 영어는 한 문자를 1로 여긴다.
- 소수점이하자리는 원 자료에 대하여 보여지는 소숫점 자리수로 유효하지 않은 숫자는 0으로 표시한다.
- 설명은 변수에 대하여 설명을 길게 할 수 있는 것으로 이름에 변수 이름을 설정하는 것과 다르게 제약없이 어떠한 문자도 입력이 가능하다. 통계분석 출력결과에 설명이 있으면 이름 값은 출력되지 않고 설명이 출력된다.
- 값 이산형, 범주형 자료인 경우 데이터 보기에 숫자로 입력하고, 여기서 숫자에 대응하는 값에 대하여 설명을 삽입할 수 있다. 문자가 원 자료에 저장된 경우 일부 분석에서 제약사항이 있기 때문에 분석이 불가능하므로 이 기능을 사용하는 것을 권장한다.
- 결측값 설정은 한 값, 또는 범위로 설정할 수 있다.
- 열은 데이터 보기에서 보여지는 열의 너비이다.
- 맞춤은 정열의 방법을 설정한다. 기본적으로 문자는 왼쪽, 숫자는 오른쪽에 정열된다.
- 측도은 자료의 형태가 척도형, 명목형, 순위형 중 선택한다.
4. 변수계산
기존에 존재하는 변수들과 연산을 실행하여 새로운 변수 생성한다. 아래의 화면은 "변환(Transform) ->변수계산(Compute)" 메뉴를 선택하였다.대상변수(Targer Variable)에 BMI, 숫자 표현식(Numeric Expression)에 bmi(body mass index, 체질량지수) = kg/m2를 변수와 제곱승 등을 이용하여 아래 그림과 같이 입력한다.
5. 생성된 변수를 테이터 보기(Data Variable) 시트에서 다음 그림과 확인할 수 있다.
6. 새로운 변수로 코딩변경
기존에 존재하는 변수를 몇 개의 범주로 나누어 새로운 변수를 생성하는 방법은 다음과 같이 두 가지가 있다.- 같은 변수로 코딩변경(Into Same Variables) : 기존에 존재하는 변수의 값이 변경하는 변수로 변함. 기존에 존재하는 변수값은 사라짐
- 다른 변수로 코딩변경(Into Different Variables) : 기존에 존재하는 변수 값을 이용하여 새로운 변수값 생성
- "변환(Transform)->다른 변수로 코딩변경(Into Different Variables)" 메뉴를 선택한다.
- bmi 변수를 선택하고 버튼을 누르면 변경할 변수가 추가되고
- 출력변수(Output Variable)에 바뀔 이름을 입력한 후 "바꾸기(Change)" 버튼을 누른다.
- "기존값 및 새로운 값(Old and New Values)" 버튼을 누르면 기존에 존재하는 변수(bmi)에 여러 조건을 입력하여 새로운 변수를 생성할 수 있다.
7. 새로운 변수로 코딩변경
BMI 변수를 범위에 따라 6개 등급으로 나누는 과정이다. 이 화면에서 bmi 변수는- 최소값에서 18.5 는 1
- 18.5 에서 23 은 2
- 23 에서 25 는 3
- 25 에서 30 은 4
- 30 에서 35 는 5
- 35 에서 최대값까지는 6
- "기존값(Old Value)->범위(Range)"를 선택
- "범위(Range)->최자값에서 다음 값까지 범위(Lowest through)" 입력창에 "18.5" 를 입력
- "새로운 값(New Value)->기준값(Value)"을 선택하고 1 을 입력
- "추가(Add)" 버튼을 누른다.
8. 새로운 변수로 코딩변경 결과
기존에 존재하는 변수에서 새로운 변수로 자료를 생성한 결과이다.9. 코딩변경
생성된 등급 변수는 1에서 6으로 분류하여 저장되었으며 이 값들은 각각- 1 은 저체중
- 2 는 정상
- 3 은 과체중
- 4 는 1 단계 비만
- 5 는 2 단계 비만
- 6 은 3 단계 비만
댓글 없음:
댓글 쓰기