바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 데이터 시각화, 검색결과: 2
초록보기
초록

코로나바이러스감염증은 인류사회가 경험하지 못한 커다란 충격과 생활양식의 급속한 변화를 만들고 있다. 비대면 사회는 감염병 확산을 예방하기 위한 과정에서 보편화된 사례이다. 코로나바이러스감염증으로 인한 사회적 영향은 광범위하다. 정부의 정책, 개인정보보호, 정보기술 등 다양한 이슈가 사회 전반에 영향을 주고 있다. 동시에 관련 사건과 이슈가 신속하고 빠르게 변하기 때문에 사실 정보를 추적하고 기록하는 것이 어렵다. 코로나-19와 실시간성 정보를 효과적으로 기술하기 위한 방안은 무엇일까? “코로나-19:우리의 기억” 프로젝트는 코로나바이러스감염증에 대한 사회문화적 영향을 가치중립적으로 기록하기 위한 시도이다. 주요 사건과 이슈를 분야별로 수집하고, 중립적인 관점으로 핵심이벤트를 기록하며, 모든 기록을 탐색할 수 있도록 디지털 아카이브로 구축한다. 프로젝트를 통해 수집, 구축한 모든 데이터, 소스코드, 시각화를 포함하는 애플리케이션은 모두 공개하여 새로운 협업을 이끌어내고 있다.

Abstract

In light of SARS-CoV-2’s significant impact, human society has experienced rapid changes in lifestyle that it has not yet experienced before. One way this virus has influenced people’s lives is the emergence of the zero-contact society, an initiative for preventing the spread of infectious diseases. As can be seen, the social impact of COVID-19 is widespread. Various issues, such as those about government policy, personal information protection, and health care, are affecting society as a whole. At the same time, factual information is difficult to track and record because of the rapid and transient nature of related events and issues. As such, a method of effectively describing COVID-19 and real-time information is necessary. The “COVID-19: Our Memory” project is an attempt to record the sociocultural impact of the coronavirus infection. This project collects major events and issues classified into several subjects, records those events from a neutral point of view, and develops a digital archive so that all records are accessible. All the data collected and built through the project, the application, including the source code and visualization, are all published to bring about new opportunities for collaboration.

2
홍덕용(부산광역시 수영구청 기록물관리전문요원) ; 허준석(㈜에이티앤아이 대표이사) 2023, Vol.23, No.4, pp.73-89 https://doi.org/10.14404/JKSARM.2023.23.4.073
초록보기
초록

본 연구에서는 텍스트 마이닝 기법을 활용하여 국내 기록관리 연구 분야의 비정형 텍스트 데이터인 국문 초록에서 사용된 키워드 빈도를 분석하여 키워드 간 거리 분석을 통해 국내기록관리 연구 동향을 파악하는 것이 목적이다. 이를 위해 한국학술지인용색인(Korea Citation Index, KCI)의 학술지 기관통계(등재지, 등재후보지)에서 대분류(복합학), 중분류(문헌정보학)으로 검색된 학술지(28종) 중 등재지 7종 1,157편을 추출하여 77,578개의 키워드를 시각화하였다. Word2vec를 활용한 t-SNE, Scattertext 등의 분석을 수행하였다. 분석 결과, 첫째로 1,157편의 논문에서 얻은 77,578개의 키워드를 빈도 분석한 결과, "기록관리"(889회), "분석"(888회), "아카이브"(742회), "기록물"(562회), "활용"(449회) 등의 키워드가 연구자들에 의해 주요 주제로 다뤄지고 있음을 확인하였다. 둘째로, Word2vec 분석을 통해 키워드 간의 벡터 표현을 생성하고 유사도 거리를 조사한 뒤, t-SNE와 Scattertext를 활용하여 시각화하였다. 시각화 결과에서 기록관리 연구 분야는 두 그룹으로 나누어졌는데 첫 번째 그룹(과거)에는 "아카이빙", "국가기록관리", "표준화", "공문서", "기록관리제도" 등의 키워드가 빈도가 높게 나타났으며, 두 번째 그룹(현재)에는 "공동체", "데이터", "기록정보서비스", "온라인", "디지털 아카이브" 등의 키워드가 주요한 관심을 받고 있는 것으로 나타났다.

Abstract

This study aims to analyze the frequency of keywords used in Korean abstracts, which are unstructured text data in the domestic record management research field, using text mining techniques to identify domestic record management research trends through distance analysis between keywords. To this end, 1,157 keywords of 77,578 journals were visualized by extracting 1,157 articles from 7 journal types (28 types) searched by major category (complex study) and middle category (literature informatics) from the institutional statistics (registered site, candidate site) of the Korean Citation Index (KCI). Analysis of t-Distributed Stochastic Neighbor Embedding (t-SNE) and Scattertext using Word2vec was performed. As a result of the analysis, first, it was confirmed that keywords such as “record management” (889 times), “analysis” (888 times), “archive” (742 times), “record” (562 times), and “utilization” (449 times) were treated as significant topics by researchers. Second, Word2vec analysis generated vector representations between keywords, and similarity distances were investigated and visualized using t-SNE and Scattertext. In the visualization results, the research area for record management was divided into two groups, with keywords such as “archiving,” “national record management,” “standardization,” “official documents,” and “record management systems” occurring frequently in the first group (past). On the other hand, keywords such as “community,” “data,” “record information service,” “online,” and “digital archives” in the second group (current) were garnering substantial focus.

한국기록관리학회지