바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 데이터 분석, 검색결과: 57
초록보기
초록

코로나바이러스감염증은 인류사회가 경험하지 못한 커다란 충격과 생활양식의 급속한 변화를 만들고 있다. 비대면 사회는 감염병 확산을 예방하기 위한 과정에서 보편화된 사례이다. 코로나바이러스감염증으로 인한 사회적 영향은 광범위하다. 정부의 정책, 개인정보보호, 정보기술 등 다양한 이슈가 사회 전반에 영향을 주고 있다. 동시에 관련 사건과 이슈가 신속하고 빠르게 변하기 때문에 사실 정보를 추적하고 기록하는 것이 어렵다. 코로나-19와 실시간성 정보를 효과적으로 기술하기 위한 방안은 무엇일까? “코로나-19:우리의 기억” 프로젝트는 코로나바이러스감염증에 대한 사회문화적 영향을 가치중립적으로 기록하기 위한 시도이다. 주요 사건과 이슈를 분야별로 수집하고, 중립적인 관점으로 핵심이벤트를 기록하며, 모든 기록을 탐색할 수 있도록 디지털 아카이브로 구축한다. 프로젝트를 통해 수집, 구축한 모든 데이터, 소스코드, 시각화를 포함하는 애플리케이션은 모두 공개하여 새로운 협업을 이끌어내고 있다.

Abstract

In light of SARS-CoV-2’s significant impact, human society has experienced rapid changes in lifestyle that it has not yet experienced before. One way this virus has influenced people’s lives is the emergence of the zero-contact society, an initiative for preventing the spread of infectious diseases. As can be seen, the social impact of COVID-19 is widespread. Various issues, such as those about government policy, personal information protection, and health care, are affecting society as a whole. At the same time, factual information is difficult to track and record because of the rapid and transient nature of related events and issues. As such, a method of effectively describing COVID-19 and real-time information is necessary. The “COVID-19: Our Memory” project is an attempt to record the sociocultural impact of the coronavirus infection. This project collects major events and issues classified into several subjects, records those events from a neutral point of view, and develops a digital archive so that all records are accessible. All the data collected and built through the project, the application, including the source code and visualization, are all published to bring about new opportunities for collaboration.

초록보기
초록

본 연구에서는 오늘날 기록관리는 정보통신 기술의 발전과 업무환경이 급변하고 정부의 규모와 여러 기능들이 확대되면서 행정업무에서 발생하는 기록과 그에 따른 데이터 생산량이 대폭 증가함에 따라 관리에 대한 중요도가 커졌다. 빅데이터의 특성을 가진 공공기록물의 개념과 빅데이터 특징을 연계하여 사례로 설명한다. 빅데이터 발생 환경에 따른 사회적, 기술적, 환경적, 경제적, 정치적 영역으로 살펴보기 위해 ‘STEEP’분석을 실시하였다. 공공기록관리분야에서 빅데이터 기술 적용 적절함과 필요성을 알아보고 활용이 가능한 업무 분석을 통해 공공기록관리 업무의 최우선 적용 가능한 프레임워크를 도식하고 업무 시사점을 제시하였다. 첫째, 공공기록관리 절차와 표준에 ‘분석’ 단계를 넣고 기록관과 기록물관리전문요원들에 의해 빅데이터 분석기술을 적용할 수 있는 신규 조직과 추가연구와 시도가 필요하다. 둘째, 많은 양의 데이터 속에 비구조화 되어있고 숨겨져 있는 패턴을 발견할 수 있도록 통합적 사고와 관련이 있는 '빅데이터 분석 자격'을 갖춘 기록물관리전문요원을 양성하여야 한다. 셋째, 공공기록분야에 빅데이터기술과 인공지능을 결합하여 자가 학습 시킨 후, 맥락을 분석하고 이를 통해 공공기관의 사회 현상과 환경을 분석하고 예측 되도록 하여야 한다.

Abstract

Today, record management has become more important in management as records generated from administrative work and data production have increased significantly, and the development of information and communication technology, the working environment, and the size and various functions of the government have expanded. It is explained as an example in connection with the concept of public records with the characteristics of big data and big data characteristics. Social, Technological, Economical, Environmental and Political (STEEP) analysis was conducted to examine such areas according to the big data generation environment. The appropriateness and necessity of applying big data technology in the field of public record management were identified, and the top priority applicable framework for public record management work was schematized, and business implications were presented. First, a new organization, additional research, and attempts are needed to apply big data analysis technology to public record management procedures and standards and to record management experts. Second, it is necessary to train record management specialists with “big data analysis qualifications” related to integrated thinking so that unstructured and hidden patterns can be found in a large amount of data. Third, after self-learning by combining big data technology and artificial intelligence in the field of public records, the context should be analyzed, and the social phenomena and environment of public institutions should be analyzed and predicted.

3
홍덕용(부산광역시 수영구청 기록물관리전문요원) ; 허준석(㈜에이티앤아이 대표이사) 2023, Vol.23, No.4, pp.73-89 https://doi.org/10.14404/JKSARM.2023.23.4.073
초록보기
초록

본 연구에서는 텍스트 마이닝 기법을 활용하여 국내 기록관리 연구 분야의 비정형 텍스트 데이터인 국문 초록에서 사용된 키워드 빈도를 분석하여 키워드 간 거리 분석을 통해 국내기록관리 연구 동향을 파악하는 것이 목적이다. 이를 위해 한국학술지인용색인(Korea Citation Index, KCI)의 학술지 기관통계(등재지, 등재후보지)에서 대분류(복합학), 중분류(문헌정보학)으로 검색된 학술지(28종) 중 등재지 7종 1,157편을 추출하여 77,578개의 키워드를 시각화하였다. Word2vec를 활용한 t-SNE, Scattertext 등의 분석을 수행하였다. 분석 결과, 첫째로 1,157편의 논문에서 얻은 77,578개의 키워드를 빈도 분석한 결과, "기록관리"(889회), "분석"(888회), "아카이브"(742회), "기록물"(562회), "활용"(449회) 등의 키워드가 연구자들에 의해 주요 주제로 다뤄지고 있음을 확인하였다. 둘째로, Word2vec 분석을 통해 키워드 간의 벡터 표현을 생성하고 유사도 거리를 조사한 뒤, t-SNE와 Scattertext를 활용하여 시각화하였다. 시각화 결과에서 기록관리 연구 분야는 두 그룹으로 나누어졌는데 첫 번째 그룹(과거)에는 "아카이빙", "국가기록관리", "표준화", "공문서", "기록관리제도" 등의 키워드가 빈도가 높게 나타났으며, 두 번째 그룹(현재)에는 "공동체", "데이터", "기록정보서비스", "온라인", "디지털 아카이브" 등의 키워드가 주요한 관심을 받고 있는 것으로 나타났다.

Abstract

This study aims to analyze the frequency of keywords used in Korean abstracts, which are unstructured text data in the domestic record management research field, using text mining techniques to identify domestic record management research trends through distance analysis between keywords. To this end, 1,157 keywords of 77,578 journals were visualized by extracting 1,157 articles from 7 journal types (28 types) searched by major category (complex study) and middle category (literature informatics) from the institutional statistics (registered site, candidate site) of the Korean Citation Index (KCI). Analysis of t-Distributed Stochastic Neighbor Embedding (t-SNE) and Scattertext using Word2vec was performed. As a result of the analysis, first, it was confirmed that keywords such as “record management” (889 times), “analysis” (888 times), “archive” (742 times), “record” (562 times), and “utilization” (449 times) were treated as significant topics by researchers. Second, Word2vec analysis generated vector representations between keywords, and similarity distances were investigated and visualized using t-SNE and Scattertext. In the visualization results, the research area for record management was divided into two groups, with keywords such as “archiving,” “national record management,” “standardization,” “official documents,” and “record management systems” occurring frequently in the first group (past). On the other hand, keywords such as “community,” “data,” “record information service,” “online,” and “digital archives” in the second group (current) were garnering substantial focus.

초록보기
초록

본 연구는 『공공데이터법』을 중심으로 관련 법제도를 분석하고, 이를 바탕으로 기록으로서의 공공데이터 관리를 위한 법제도적 미비점을 비판적으로 논하는 데 목적을 둔다. 이를 위해 다학제 영역의 선행연구를 분석하고, 관련 법령에서 사용되고 있는 공공데이터와 그 유사 용어를 이론적 측면에서 논하였으며, 관련 법령의 연혁을 살펴보았다.『공공데이터법』의 제정 의의와 주요내용을 법이 규정한 관련 위원회 및 기관을 중심으로 정리하고, ‘제공대상 범위설정의 문제’, ‘공공데이터제공책임관의 전문성 및 기능의 실효성’, ‘공공데이터의 낮은 품질’, ‘절차법적 한계와 기록관리 관점의 부재’ 등 4가지 논점의 비판적 분석을 통해 법령을 고찰하였다.

Abstract

The study aims to analyze the Public Data Act and provide alternative strategies for public data management. It conducts an extensive literature review based on a multidisciplinary approach and discusses the terms, public data and synonyms from the Public Data Act, and other related laws while also studies and traces the history of related regulations. The significance of the Public Data Act is analyzed and the major contents of the Act are examined, particularly, the contents that describe relevant committees. As a result, the article discusses five issues: relation between regulations, ambiguity of decision-making standards, ‘professionality of a public data supply officer, low quality of public data, and lack of records and archives management.

초록보기
초록

본 고에서는 전자인사관시스템 데이터세트의 관리기준표 작성 절차와 방법, 참여 기관의 역할, 관리기준표 영역별 작성 내용 등을 기록관담당자 입장에서 분석하여 관리기준표를 수립해야하는 업무담당자의 이해를 돕고, 기준표 작성 과정 중에 나타난 문제점을 바탕으로 개선방안을 제시하였다. 주요 개선방안으로, 국가적 중요 행정정보 데이터세트에 대해서는 영구기록물관리기관 차원의 별도 선별 정책이 마련되어야 하고 일부가 아닌 전체 데이터세트를 보존하는 방식으로 운영되어야 하겠다. 또 단위기능 설정과 데이터 분석을 위해 단위기능-데이터테이블-비정형데이터 매핑 자료를 필수작성 사항으로 설정할 필요가 있으며 시스템 운영에 큰 영향을 미치는 비정형데이터에 대한 선별, 관리 기준이 추가로 작성되어야 하겠다. 처분지연기간을 설정하는 것은 보존기간의 복잡성을 증가시키는 측면이 있으므로 관련 단위기능의 통합 또는 보존기간 상향 책정 등의 방식으로 운영하는 것이 바람직할 것으로 판단된다.

Abstract

The study seeks to analyze the procedures and methods of preparing the records management reference table of the electronic human resource management system dataset, the roles of participating organizations, and the contents of each management reference table area from the records manager’s perspective to help the person in charge of establishing the management reference table. Improvement plans were suggested based on the problems that appeared during the process of preparing the reference table. As a major improvement plan, a separate selecting policy at the level of the national archives should be designed for the national important dataset records in the government information system, which should be operated such that it preserves the entire dataset rather than a part. It is necessary to set the unit function-data table-unstructured data mapping data as mandatory items, and the selection and management criteria for unstructured data that significantly influence system operation should be additionally prepared. Regarding the setting of the disposition delay period, because there is an aspect of increasing complexity, it is deemed desirable to operate it by integrating related unit functions or setting the retention period longer.

초록보기
초록

정부기관 및 기업에서는 다양한 데이터세트가 생산된다. 업무활동의 일부로 생산되는 데이터세트는 현재 단순히 정보시스템 내에 저장되어 있고, 기록으로 획득되어 관리되고 있지 못하다. 원 데이터로서 업무활동에서 발생한 데이터세트 기록은, 시급히 기록관리 영역으로 편입되어 관리되지 않는다면, 오래지 않아 사장될 것이다. 데이터세트는 정부 정책 및 법제도 형성에 있어 기본 데이터로 활용 가능할 뿐 아니라 정책결정과정을 보여주는 증거로서 데이터세트 기록의 관리와 보존은 반드시 필요하다. 따라서 본 연구는 기록으로서의 데이터세트 관리 필요성을 지적하고 해외의 사례를 분석하여 데이터세트 기록관리의 기초 자료를 제공하고자 하였다.

Abstract

The purpose of the study is to propose the necessity of management and long-term preservation of dataset as records. Although government and corporate bodies produce various dataset in the regular course of the business, dataset have been stored and managed in the information system. Dataset as records should be captured into the record management system and managed in the overall system. They can provide a evidence of the decision-making process of the government and fundamental information of the process. If agents do not perform the right management, dataset records will disappear in the future.

초록보기
초록

연구데이터의 연구의 정확성이나 신뢰성 확보를 위한 정보적 가치, 연구의 재현 또는 검증, 재사용 가능성을 연구데이터에 대한 체계적 관리가 강조되고 있다. 표준 메타데이터는 연구데이터 생산, 관리, 구조화, 기탁된 데이터 추출에 핵심 역할을 수행할 것이다. 연구데이터는 연구, 연구데이터, 데이터셋, 파일 등 다양한 계층적 관계를 가지고 있으며, 인용 및 연구성과 등의 엔터티와 연계되어 있다. 이에 본 연구에서는 연구데이터 관리를 위한 온톨로지 모델을 제시하고자 한다. NTIS 사례를 제시하여 연구의 적용가능성을 제시하였다. 이를 위해 기존 연구데이터 관련 선행연구, 메타데이터 표준의 분석, 연구데이터 리포지터리 사례조사를 실시하였다.

Abstract

The systematic management of research data is vital because it increases research data’s value for research reproduction, verification, and reusability. Standard metadata will play a key role in research data registration, management, and data extraction. Research data has various structural relationships, such as research, research data, data sets, and files, and associated with entities such as citations and research results. The study proposes an ontology model for research data management. It also suggests the application of ontology to NTIS. Previous studies, metadata standard analyses, and research data repository case studies were conducted.

8
서지인(부산대학교 대학원 문헌정보학과 기록관리학전공) 2020, Vol.20, No.4, pp.41-58 https://doi.org/10.14404/JKSARM.2020.20.4.041
초록보기
초록

많은 연구에서 행정정보 데이터세트의 중요성을 언급해왔으나 지금까지 실질적인 관리는 전무했다. 이런 상황에서 2020년 국가기록원은 행정정보 데이터세트 관리를 중점 추진사업으로 선정하며 본격적인 관리 작업에 착수하였다. 국가기록원의 노력에도 불구하고 업무를 수행하여야 할 기록관은 새로운 사업에 대한 우려를 보였다. 이에 이 연구에서는 공공기관에서 이미 실시하고 있는 공공데이터 사업과의 비교를 통해 행정정보 데이터세트 관리의 문제점을 확인하고, 개선방안을 찾고자 하였다. 법률, 고시, 지침, 소관 부처에서 발행한 간행물의 내용을 중심으로 대상을 분석, 비교하였다. 분석 결과를 토대로 단위기능 책정시 정부기능분류 참조, 행정정보 데이터세트 관리기준표 재구성, 유관 시스템과의 데이터 연계를 행정정보 데이터세트 관리의 개선방안으로 제안하였다.

Abstract

Although numerous studies have noted the importance of data sets in government information systems, the practical management of data sets has yet to be developed. Under these circumstances, the National Archives of Korea designated data set management as a major project in 2020, initiating full-scale management work. Despite these efforts, the records center, which will conduct management, expressed great concern for the new project. As such, this study identifies problems in managing data sets and searches for possible improvements through a comparison with existing public data projects by public institutions. In particular, the following materials were analyzed: laws, notices, guidelines, and publications issued by the ministries. Based on the results, several measures were proposed as part of an improvement plan for data set management: (1) the utilization of government functional classification as a reference, (2) the reorganization of the table, and (3) data linkage with related systems.

초록보기
초록

최근 각국은 정부 데이터 개방을 위한 데이터 플랫폼을 구축하고, 행정정보데이터세트 등 다양한 데이터를 민간에서 웹을 통해 자유롭게 활용하도록 하고 있다. 이 연구는 전 세계적으로 가장 많이 활용되는 대표적인 오픈 데이터 플랫폼인 소크라타와 CKAN의 기능을 분석하고, 각국의 활용 사례를 살펴보았다. 그리고 서울시의 데이터세트 서비스 현황을 사례로 검토하여, 오픈 데이터 플랫폼을 적용한 지방자치단체의 데이터세트 관리 및 서비스 방안을 개념적으로 제시하였다. 이를 통해 기록으로서의 데이터세트 서비스 제공을 위한 지방자치단체의 장기적인 보존과 관리체제 방안을 제도적 측면과 데이터의 생산 및 관리 측면, 서비스 측면 및 플랫폼의 선택 등 다양한 측면에서 제시하였다.

Abstract

Recently many countries have established data platforms to disclose government-owned data that include administrative data-sets and provide free access to the public via Web. This research analyzes the “Socrata" and “CKAN", the most popular representative open data platforms in the world, and reviews functions and their practical cases in operation in several cities of various nations. It also examines the current status of the data-set services in the City of Seoul to provide conceptual bases for management and service of the local governments’ data-sets using open data platform. Then it suggests measures that ensure the long-term preservation and management of data-sets as archives for services, which includes the aspects of preparing systems, creating and managing data, providing services, and selecting platforms.

10
도슬기(한성대학교 디지털인문정보학트랙 강사) ; 박희진(한성대학교 디지털인문정보학트랙 부교수) 2023, Vol.23, No.2, pp.95-115 https://doi.org/10.14404/JKSARM.2023.23.2.095
초록보기
초록

본 연구는 세계기록유산으로 등재된 국채보상운동 디지털 아카이브 기록물의 활용성을 높이기 위한 방안으로 위키데이터와 연계하는 데이터 모델을 설계하고, 적용가능성을 검토하였다. 국채보상운동 기록물 메타데이터, 시소러스, 시맨틱 네트워크 그래프를 분석하여 시사점을 도출하고, 기록물의 내용 분석을 통해 위키데이터와 연계를 위한 데이터 모델의 클래스인 기록물건, 행위주체, 시간, 장소, 사건을 도출하였다. 또한 클래스 간 연결을 위한 관계 속성들을 파악하여, 설계한 데이터 모델을 실제 기록물 사례에 적용해봄으로써, 속성을 중심으로 한 객체 간의 이동을 통해 풍부한 관련 정보들을 획득할 수 있는 가능성을 확인하였다. 본 연구의 결과는 소규모 로컬 아카이브에서 위키데이터를 활용한 데이터의 공유와 활용 체계 마련에 활용될 수 있을 것이다.

Abstract

This study designed a data model linked to Wikidata and examined its applicability to increase the utilization of the digital archive records of the National Debt Redemption Movement, registered as World Memory Heritage, and implications were derived by analyzing the existing metadata, thesaurus, and semantic network graph. Through analysis of the original text of the National Debt Redemption Movement records, key data model classes for linking with Wikidata, such as record item, agent, time, place, and event, were derived. In addition, by identifying core properties for linking between classes and applying the designed data model to actual records, the possibility of acquiring abundant related information was confirmed through movement between classes centered on properties. Thus, this study’s result showed that Wikidata’s strengths could be utilized to increase data usage in local archives where the scale and management of data are relatively small. Therefore, it can be considered for application in a small-scale archive similar to the National Debt Redemption Movement digital archive.

한국기록관리학회지