GIS

국립공원 자원통합 DB 기초분석 (3) - 속성 테이블 통계 분석

유병혁 2012. 2. 12. 11:28

이번 글에서는 포유류 데이터의 속성 테이블을 일부 수정하고 간단한 통계분석을 해보겠습니다.

먼저 포유류 데이터의 속성 테이블을 열어 보겠습니다.

 

속성 테이블의 모든 필드들이 분석에 유의한 값들을 제공하지는 않습니다.
가장 중요한 필드값 중 하나인 발견시기와 상응하는 필드로는 '시작일'과 '종료일'이 있습니다.

학습하고 있는 포유류는 식생조사 등과 다르게 발견시점(일)이 명확하기 때문에, 시작일과 종료일은 차이가 없을 것으로 판단됩니다.

직접 확인해 보겠습니다.

 

Select By Attributes에서 검색조건을 아래와 같이 설정합니다.

 

확인 결과, 전체 레코드들 중 '시작일'과 '종료일'이 불일치하는 경우가 아래 3건으로 조회됩니다.
시작일이 2003년, 종료일이 2009년으로 되어 있는데 종료일이 입력 오류이고 2003년 데이터에 해당됩니다.

 

시기별 통계 분석을 년과 월 단위로 하기 위해서 별도의 필드를 추가해 보도록 하겠습니다.
속성 테이블 하단의 Options > Add Field를 클릭합니다.

 

Name은 YEAR(년)를, Type은 Short Integer로 설정하고 OK 버튼을 클릭합니다.
같은 방식으로 Name은 MONTH(월)를, Type은 Short Integer로 설정하고 OK 버튼을 클릭합니다.

 

이렇게 년과 월을 입력할 수 있는 비어있는 두 개의 필드를 생성하였습니다.

 

이제 비어있는 필드에 값을 입력해 보겠습니다.
YEAR 필드명에서 우클릭하고 Field Calculator를 선택합니다.

 

아래와 같이 Left 함수를 사용하여 '시작일' 필드에서 년 값을 입력합니다.

 

같은 방식으로 MONTH 필드는 Mid 함수를 사용하여 '시작일' 필드에서 월 값을 입력합니다.

 

YEAR(년), MONTH(월) 필드값 입력 결과입니다.
이제 입력된 필드값들을 통해 간단한 통계 분석을 해보겠습니다.

 

현재 학습하고 있는 파일이 있는 폴더로 이동합니다.

해당 폴더에서 파일명을 보면, 하나의 파일이 다양한 확장자로 구분됨을 확인할 수 있습니다.
즉, 쉐이프파일은 *.dbf, *.prj, *.sbn, *.sbx, *.shp, *.shx로 구성되어 있습니다.
여기서 *.dbf는 쉐이프파일의 속성 테이블에 해당하는 정보입니다.
일단, 이 파일을 엑셀에서 불러와서 '다른 이름으로 저장'합니다.

 

여기서는 확인종, 년, 월 필드값을 가지고 통계치를 살펴보도록 하겠습니다.

 

(엑셀 2007을 기준으로)삽입 > 피벗 테이블 > 피벗 테이블을 클릭합니다.

 

분석할 데이터와 피벗 테이블을 넣을 위치를 지정합니다.

 

피벗 테이블 필드 목록에서 열, 행, 그리고 값을 지정하여 통계치를 구해보겠습니다.

 

먼저 년도별로 지리산 포유류 DB가 입력된 발견 건(수)을 구한 결과입니다.
2002년이 발견이 가장 많고 2008년이 가장 적은 것으로 파악이 됩니다.
2006년은 현재 입력 건이 전혀 없는데 이 부분은 별도의 확인이 필요할 것 같습니다.

 

다음은 월별로 구분한 포유류 발견 건(수)입니다.
조사시기와 연관이 있을 텐데, 5월과 9월에 가장 많은 발견이 있음을 알 수 있습니다.

 

다음은 종별 발견 건(수)입니다.
지리산에는 총 24종의 포유류가 입력되어 있음을 확인할 수 있습니다.

 

참고로, 2011년 국립공원 기본통계에 기록된 지리산 포유류 현황은 아래와 같습니다.

비교해 보면 두더지, 대륙밭쥐를 제외한 항목들은 현재 시스템에 입력되어 있음을 알 수 있습니다.
기본통계에는 기록되지 않았지만 실제 시스템 내 등록된 확인종으로는
고양이, 비단털들쥐, 삵, 생쥐, 수달, 염소, 청설모, 하늘다람쥐가 있습니다.