바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 텍스트 분석, 검색결과: 2
1
홍덕용(부산광역시 수영구청 기록물관리전문요원) ; 허준석(㈜에이티앤아이 대표이사) 2023, Vol.23, No.4, pp.73-89 https://doi.org/10.14404/JKSARM.2023.23.4.073
초록보기
초록

본 연구에서는 텍스트 마이닝 기법을 활용하여 국내 기록관리 연구 분야의 비정형 텍스트 데이터인 국문 초록에서 사용된 키워드 빈도를 분석하여 키워드 간 거리 분석을 통해 국내기록관리 연구 동향을 파악하는 것이 목적이다. 이를 위해 한국학술지인용색인(Korea Citation Index, KCI)의 학술지 기관통계(등재지, 등재후보지)에서 대분류(복합학), 중분류(문헌정보학)으로 검색된 학술지(28종) 중 등재지 7종 1,157편을 추출하여 77,578개의 키워드를 시각화하였다. Word2vec를 활용한 t-SNE, Scattertext 등의 분석을 수행하였다. 분석 결과, 첫째로 1,157편의 논문에서 얻은 77,578개의 키워드를 빈도 분석한 결과, "기록관리"(889회), "분석"(888회), "아카이브"(742회), "기록물"(562회), "활용"(449회) 등의 키워드가 연구자들에 의해 주요 주제로 다뤄지고 있음을 확인하였다. 둘째로, Word2vec 분석을 통해 키워드 간의 벡터 표현을 생성하고 유사도 거리를 조사한 뒤, t-SNE와 Scattertext를 활용하여 시각화하였다. 시각화 결과에서 기록관리 연구 분야는 두 그룹으로 나누어졌는데 첫 번째 그룹(과거)에는 "아카이빙", "국가기록관리", "표준화", "공문서", "기록관리제도" 등의 키워드가 빈도가 높게 나타났으며, 두 번째 그룹(현재)에는 "공동체", "데이터", "기록정보서비스", "온라인", "디지털 아카이브" 등의 키워드가 주요한 관심을 받고 있는 것으로 나타났다.

Abstract

This study aims to analyze the frequency of keywords used in Korean abstracts, which are unstructured text data in the domestic record management research field, using text mining techniques to identify domestic record management research trends through distance analysis between keywords. To this end, 1,157 keywords of 77,578 journals were visualized by extracting 1,157 articles from 7 journal types (28 types) searched by major category (complex study) and middle category (literature informatics) from the institutional statistics (registered site, candidate site) of the Korean Citation Index (KCI). Analysis of t-Distributed Stochastic Neighbor Embedding (t-SNE) and Scattertext using Word2vec was performed. As a result of the analysis, first, it was confirmed that keywords such as “record management” (889 times), “analysis” (888 times), “archive” (742 times), “record” (562 times), and “utilization” (449 times) were treated as significant topics by researchers. Second, Word2vec analysis generated vector representations between keywords, and similarity distances were investigated and visualized using t-SNE and Scattertext. In the visualization results, the research area for record management was divided into two groups, with keywords such as “archiving,” “national record management,” “standardization,” “official documents,” and “record management systems” occurring frequently in the first group (past). On the other hand, keywords such as “community,” “data,” “record information service,” “online,” and “digital archives” in the second group (current) were garnering substantial focus.

2
이혜원(서울여자대학교) ; 한승희(서울여자대학교) 2023, Vol.23, No.1, pp.101-126 https://doi.org/10.14404/JKSARM.2023.23.1.101
초록보기
초록

대학의 사진기록은 대학의 정체성을 확립하고 역사적 증거를 제공하는 매우 가치 있는 기록의 유형 중 하나이나, 텍스트와 달리 의미전달의 취약성을 갖고 있으므로 사진기록의 정보가 포괄적으로 기술되지 않으면 이용자의 검색과 활용이 어렵다. 본 연구에서는 대학기록관 사진 아카이브를 위해 사진기록의 분류체계를 구조화하고, 분류 내의 카테고리 특성을 반영한 메타데이터 셋 개발을 시도하였다. 이를 위해 국내와 미국 대학기록관의 사진기록 분류체계와 메타데이터 요소를 분석하고, 정보구조 모형을 제안하였다. 본 연구에서 제안한 정보구조 모형을 통해 대학기록관 사진기록의 데이터 품질을 향상시킬 수 있으며, 이용자에게는 사진기록에 대한 풍부한 디스커버리를 지원할 수 있다.

Abstract

Photographic archives of universities are one of the most valuable types of records that establish the university’s identity and provide historical evidence. Unlike text records, however, they are weak in conveying meanings. Therefore, it is difficult to support users' search and utilization unless the information of photo records is comprehensively described. In this study, for the university photo archives, we tried to structure the classification system of photo archives and develop a metadata set that reflects the category characteristics in the classification. To this end, the photo archives classification system and metadata elements of domestic and American university archives were analyzed and based on this, the model of information structure was proposed. The information structure model presented in this study can help university archives improve the data quality of their photo archives and support users with the abundant discovery of photo archives.

한국기록관리학회지