안녕하세요? 이번 글은 VOSviewer를 통해 'national park(국립공원)'가 언급된 공학분야 연구논문 1천편 RIS를 텍스트 마이닝해 보겠습니다. 실습용 RIS 데이터 확보 방법은 아래 글을 참고하시면 됩니다.
VOSviewer는 웹 오브 사이언스(Web of Science), 스코퍼스(Scopus), 펍메드(PubMed)와 같은 논문 데이터베이스로부터 추출한 인용(citation) 데이터를 텍스트 마이닝 처리할 수 있는 도구입니다. 이 도구는 네덜란드 레이던 대학교(Leiden University)의 과학기술연구센터(CWTS, Centre for Science and Technology Studies)에서 개발하였습니다.
자, 그럼 실습을 진행해볼까요?! VOSviewer 공식 홈페이지에 접속합니다.
'Download VOSviewer'를 클릭합니다.
내 시스템 환경에 맞는 VOSviewer 파일을 내려받습니다.
압축을 해제한 후 VOSviewer.exe를 실행합니다.
VOSviewer는 Java Runtime Environment 1.8.0을 필요로 합니다. 확인 버튼을 클릭하면 설치 페이지로 자동 이동합니다.
Java Runtime을 설치합니다.
다시 실행하면 VOSviewer 창이 아래와 같이 표시됩니다.
왼쪽 화면에서 'Map > Create(지도 > 생성)'를 클릭합니다.
'Create type of data > Create a map based on bibliographic data(데이터 유형 생성 > 서지 데이터 기반으로 지도 생성)'를 클릭합니다.
'Choose data source > Read data from reference manager files(데이터 소스 선택 > 참고문헌 관리자 파일에서 데이터 읽기'를 선택합니다.
'Select files > RIS(파일 선택 > RIS)' 탭을 선택하고,
앞서 내려받은 10개 RIS 파일을 선택해 줍니다.
다음으로 'Type of analysis(분석 유형)'와 'Counting method(계수 방법)'을 선택합니다.
분석 유형은 'Co-occurrence(동시 발생)'을, 계수 방법은 'Full counting(전체 계수)'을 체크해 봅니다.
'Minimum number of occurrences of a keyword(키워드의 최소 발생 횟수)'는 3으로 설정해 봅니다.
'Number of keywords to be selected(선택할 키워드 수)는 최소 3회 이상 출현한 111개 항목을 모두 선택해 보겠습니다.
선택된 키워드의 Occurrences(출현) 건수와 Total link strength(전체 링크 강도)는 다음과 같습니다. covid-19은 25편의 논문 키워드로 언급되었고 14편의 논문에서 동시 언급된 링크가 존재하는 것을 확인할 수 있습니다.
'네트워크에 있는 111개 항목 중 일부가 서로 연결되어 있지 않습니다. 가장 큰 연결 항목 집합은 73개 항목으로 구성됩니다. 모든 항목 대신 이 항목 집합을 표시하시겠습니까?'라고 묻습니다. 저는 가장 큰 연결 항목 집합만 확인해 보겠습니다.
결과는 아래와 같습니다. 네트워크 가시화 결과가 흥미롭죠?!
오른쪽에서 'Visualization > Scale(가시화 > 스케일)'과 'Labels > Size variation(라벨 > 크기 변형)'을 최대로 조정합니다.
이번애는 'Colors > black background(색상 > 검은 배경)'을 체크해 보겠습니다.
네트워크 가시화 결과는 'File > Screenshot > Save(파일 > 스크린샷 > 저장)'을 통해 내려받을 수 있습니다! 보다 자세한 사용법은 VOSviewer 다운로드 시 함께 제공되는 'Manual_VOSviewer_1.6.18.pdf'를 보시면 됩니다.