Skip to Main Content
한양대학교 ERICA 학술정보관 (Hanyang University ERICA Library)

ERICA학술정보관: Jupyter Notebook 이용

- 학술정보관 가이드 - 학술정보활용 가이드 - 학습 및 연구 지원

ProQuest TDM Studio : 텍스트 데이터 마이닝 솔루션

 

TDM Studio는 연구, 교육 및 학습을 위한 텍스트 및 데이터 마이닝 솔루션입니다. 수천 개 혹은 수백만 개의 문서를 분석해야 하는 작업은 어떤 사람에게도 불가능한 작업이며, TDM(텍스트 및 데이터 마이닝)이 필요한 영역이기도 합니다. ProQuest의 TDM Studio를 통해 연구자들은 방대한 데이터의 수집, 정리, 분석에 필요한 시간을 절약할 수 있습니다. TDM Studio는 새로운 발견을 위한 다음 두 가지 방법을 지원합니다. TDM Studio Workbench는 자체 코딩 방법을 사용하는 숙련된 연구자를 위해, TDM Studio Visualization은 모든 레벨의 사용자가 신속하게 추세를 파악하고 통찰력을 얻을 수 있도록 설계되었습니다. 

Jupyter Notebook 이용

Jupyter Notebook으로 데이터셋 불러오기

ProQuest TDM Studio 우측 상단의 "Open Jupyter Notebook"을 클릭하여 개발환경으로 접속하면 여러 개의 폴더가 있는 Jupyter Notebook 실행화면을 볼 수 있습니다. 생성된 데이터셋을 Jupyter Notebook에서 접속하기 위해 Files 탭의 Start Here.ipynb 파일을 클릭합니다. 

    

Step 1 - Name Your Dataset의 첫번째 Cell을 실행합니다.(상단의 Run 메뉴 클릭) 그리고 데이터셋 이름을 입력할 수 있는 "Name of dataset" 상자가 나타나면 데이터셋 작업을 통해 생성한 데이터셋의 이름(Name)을 입력합니다.

Step 2 - Select Your Dataset의 Cell을 실행하면 ProQuest TDM Studio에서 생성한 데이터셋을 선택할 수 있는 드롭다운 메뉴가 제공됩니다. 반출하고자 하는 데이터셋을 선택합니다.

 

Jupyter Notebook에서 파일 반출하기

ProQuest TDM Studio Manual 폴더에 있는 Export Instruction.ipynb 파일을 클릭합니다. 그리고 Jupyter Notebook의 data폴더에 있는 파일명을 입력 후 각각의 Cell을 실행(Run)합니다.

반출 명령이 정상적으로 처리 되었을 경우 아래와 같이 tdm.results@proquest.com의 메일을 통해 “ProQuest TDM Studio Successful Export! 제목의 메일이 발송됩니다.

Copyright(C) 2021 HANYANG UNIVERSITY ALL RIGHTS RESERVED.