Skip to Main Content
한양대학교 ERICA 학술정보관 (Hanyang University ERICA Library)

ERICA학술정보관: TDM Studio : Text Data Mining

- 학술정보관 가이드 - 학술정보활용 가이드 - 학습 및 연구 지원

ProQuest TDM Studio : 텍스트 데이터 마이닝 솔루션

 

TDM Studio는 연구, 교육 및 학습을 위한 텍스트 및 데이터 마이닝 솔루션입니다. 수천 개 혹은 수백만 개의 문서를 분석해야 하는 작업은 어떤 사람에게도 불가능한 작업이며, TDM(텍스트 및 데이터 마이닝)이 필요한 영역이기도 합니다. ProQuest의 TDM Studio를 통해 연구자들은 방대한 데이터의 수집, 정리, 분석에 필요한 시간을 절약할 수 있습니다. TDM Studio는 새로운 발견을 위한 다음 두 가지 방법을 지원합니다. TDM Studio Workbench는 자체 코딩 방법을 사용하는 숙련된 연구자를 위해, TDM Studio Visualization은 모든 레벨의 사용자가 신속하게 추세를 파악하고 통찰력을 얻을 수 있도록 설계되었습니다. 

ProQuest TDM Studio란?

ProQuest에서 제공하는 2만 종 이상의 출판물(저널, 신문, 매거진, 뉴스 등)과 데이터베이스(Web DB)를 대상으로 텍스트마이닝/ Dataset 생성, Python & R 연계, Visualization(Geographical analysis / Topic Modeling ) 서비스를 제공합니다. 그리고 데이터 수집 및 정리, 분석에 필요한 시간과 비용을 절약할 수 있으며, 데이터 사용에 따른 저작권 문제없이 이용이 가능합니다.

텍스트 데이터 마이닝 이용 콘텐츠

ProQuest 플랫폼을 통해 학술정보관에서 구독하고 있는 콘텐츠로서 그 유형은 다음과 같습니다.

  • 학술저널 : Nature Communications, Nature, Psychological Bulletin 등 학술저널 1만종 이상
  • 매거진 : The Economist, Foreign Affairs, Variety, Adweek 등 매거진 1천종 이상
  • 신문 : The Wall Street journal, The New York Times, The Washington Post 해외 주요 신문 / 뉴스 정보 2천종 이상 
  • 데이터베이스 : PQDT Global(ProQuest Dissertations & Theses Global), International Newsstream, ProQuest Central 등 

각 출판물의 텍스트마이닝 가능기간(Coverage)은 ProQuest TDM Studio 플랫폼 “Select Publication Titles“에서 출판물(저널,신문,매거진 등)별로 확인 가능합니다.(해당 상세 페이지 참조)

 

Workbench dashboard

텍스트 & 데이터 마이닝 작업을 위한 개인 작업공간으로 2만여건의 출판물과 ProQuest 데이터베이스를 검색 후 Dataset을 생성 할 수 있습니다.
Dataset 생성을 위한 다양한 검색조건 “Select Publication Titles”, “Refine Content”기능을 통해 검색조건 및 결과를 다양하게 적용 가능합니다.

Visualizaton dashboard

별도의 코딩지식 및 추가 작업없이 검색결과에 대한 시각화한 결과를 지원하는 기능으로 현재  (1)Geographical analysis, (2)Topic Modeling 2개 기능의 이용이 가능합니다. The Wall Street Journal, The New York Times, The Washington Post 등 10개 주요 신문과 PQDT ( ProQuest Dissertation and Theses )를 대상으로 검색 및 시각화 결과 도출이 가능 합니다.

1) Topic Modeling Visualization 예시

 

2) Geographic Visualization 예시

 

Copyright(C) 2021 HANYANG UNIVERSITY ALL RIGHTS RESERVED.