바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: text analysis, 검색결과: 2
1
홍덕용(부산광역시 수영구청 기록물관리전문요원) ; 허준석(㈜에이티앤아이 대표이사) 2023, Vol.23, No.4, pp.73-89 https://doi.org/10.14404/JKSARM.2023.23.4.073
초록보기
초록

본 연구에서는 텍스트 마이닝 기법을 활용하여 국내 기록관리 연구 분야의 비정형 텍스트 데이터인 국문 초록에서 사용된 키워드 빈도를 분석하여 키워드 간 거리 분석을 통해 국내기록관리 연구 동향을 파악하는 것이 목적이다. 이를 위해 한국학술지인용색인(Korea Citation Index, KCI)의 학술지 기관통계(등재지, 등재후보지)에서 대분류(복합학), 중분류(문헌정보학)으로 검색된 학술지(28종) 중 등재지 7종 1,157편을 추출하여 77,578개의 키워드를 시각화하였다. Word2vec를 활용한 t-SNE, Scattertext 등의 분석을 수행하였다. 분석 결과, 첫째로 1,157편의 논문에서 얻은 77,578개의 키워드를 빈도 분석한 결과, "기록관리"(889회), "분석"(888회), "아카이브"(742회), "기록물"(562회), "활용"(449회) 등의 키워드가 연구자들에 의해 주요 주제로 다뤄지고 있음을 확인하였다. 둘째로, Word2vec 분석을 통해 키워드 간의 벡터 표현을 생성하고 유사도 거리를 조사한 뒤, t-SNE와 Scattertext를 활용하여 시각화하였다. 시각화 결과에서 기록관리 연구 분야는 두 그룹으로 나누어졌는데 첫 번째 그룹(과거)에는 "아카이빙", "국가기록관리", "표준화", "공문서", "기록관리제도" 등의 키워드가 빈도가 높게 나타났으며, 두 번째 그룹(현재)에는 "공동체", "데이터", "기록정보서비스", "온라인", "디지털 아카이브" 등의 키워드가 주요한 관심을 받고 있는 것으로 나타났다.

Abstract

This study aims to analyze the frequency of keywords used in Korean abstracts, which are unstructured text data in the domestic record management research field, using text mining techniques to identify domestic record management research trends through distance analysis between keywords. To this end, 1,157 keywords of 77,578 journals were visualized by extracting 1,157 articles from 7 journal types (28 types) searched by major category (complex study) and middle category (literature informatics) from the institutional statistics (registered site, candidate site) of the Korean Citation Index (KCI). Analysis of t-Distributed Stochastic Neighbor Embedding (t-SNE) and Scattertext using Word2vec was performed. As a result of the analysis, first, it was confirmed that keywords such as “record management” (889 times), “analysis” (888 times), “archive” (742 times), “record” (562 times), and “utilization” (449 times) were treated as significant topics by researchers. Second, Word2vec analysis generated vector representations between keywords, and similarity distances were investigated and visualized using t-SNE and Scattertext. In the visualization results, the research area for record management was divided into two groups, with keywords such as “archiving,” “national record management,” “standardization,” “official documents,” and “record management systems” occurring frequently in the first group (past). On the other hand, keywords such as “community,” “data,” “record information service,” “online,” and “digital archives” in the second group (current) were garnering substantial focus.

2
도슬기(한성대학교 디지털인문정보학트랙 강사) ; 박희진(한성대학교 디지털인문정보학트랙 부교수) 2023, Vol.23, No.2, pp.95-115 https://doi.org/10.14404/JKSARM.2023.23.2.095
초록보기
초록

본 연구는 세계기록유산으로 등재된 국채보상운동 디지털 아카이브 기록물의 활용성을 높이기 위한 방안으로 위키데이터와 연계하는 데이터 모델을 설계하고, 적용가능성을 검토하였다. 국채보상운동 기록물 메타데이터, 시소러스, 시맨틱 네트워크 그래프를 분석하여 시사점을 도출하고, 기록물의 내용 분석을 통해 위키데이터와 연계를 위한 데이터 모델의 클래스인 기록물건, 행위주체, 시간, 장소, 사건을 도출하였다. 또한 클래스 간 연결을 위한 관계 속성들을 파악하여, 설계한 데이터 모델을 실제 기록물 사례에 적용해봄으로써, 속성을 중심으로 한 객체 간의 이동을 통해 풍부한 관련 정보들을 획득할 수 있는 가능성을 확인하였다. 본 연구의 결과는 소규모 로컬 아카이브에서 위키데이터를 활용한 데이터의 공유와 활용 체계 마련에 활용될 수 있을 것이다.

Abstract

This study designed a data model linked to Wikidata and examined its applicability to increase the utilization of the digital archive records of the National Debt Redemption Movement, registered as World Memory Heritage, and implications were derived by analyzing the existing metadata, thesaurus, and semantic network graph. Through analysis of the original text of the National Debt Redemption Movement records, key data model classes for linking with Wikidata, such as record item, agent, time, place, and event, were derived. In addition, by identifying core properties for linking between classes and applying the designed data model to actual records, the possibility of acquiring abundant related information was confirmed through movement between classes centered on properties. Thus, this study’s result showed that Wikidata’s strengths could be utilized to increase data usage in local archives where the scale and management of data are relatively small. Therefore, it can be considered for application in a small-scale archive similar to the National Debt Redemption Movement digital archive.

한국기록관리학회지