바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: Digital records, 검색결과: 75
초록보기
초록

기록물은 과거와 현재를 포함하는 시간적 특성, 특정 언어에 제한되지 않는 언어적 특성, 기록물이 갖고 있는 다양한 유형을 복합적으로 갖고 있다. 기록물의 생성, 보존, 활용에 이르는 생애주기에서 텍스트, 영상, 음성으로 구성된 데이터의 처리는 많은 노력과 비용을 수반한다. 기계번역, 문서요약, 개체명 인식, 이미지 인식 등 자연어 처리 분야의 주요 기술은 전자기록과 아날로그 형태의 디지털화에 광범위하게 적용할 수 있다. 특히, 딥러닝 기술이 적용된 한국어 자연어 처리 분야는 다양한 형식의 기록물을 인식하고, 기록관리 메타데이터를 생성하는데 효과적이다. 본 논문은 한국어 자연어 처리를 기술을 소개하고, 기록 관리 분야에서 자연어 처리 기술을 적용하기 위한 고려사항을 논의한다. 기계번역, 광학문자인식과 같은 자연어 처리 기술이 기록물의 디지털 변환에 적용되는 과정은 파이썬 환경에서 구현한 사례로 소개한다. 한편, 자연어 처리 기술의 활용을 위해 기록관리 분야에서 자연어 처리 기술을 적용하기 위한 환경적 요소와 기록물의 디지털화 지침을 개선하기 위한 방안을 제안한다.

Abstract

Records have temporal characteristics, including the past and present; linguistic characteristics not limited to a specific language; and various types categorized in a complex way. Processing records such as text, video, and audio in the life cycle of records’ creation, preservation, and utilization entails exhaustive effort and cost. Primary natural language processing (NLP) technologies, such as machine translation, document summarization, named-entity recognition, and image recognition, can be widely applied to electronic records and analog digitization. In particular, Korean deep learning–based NLP technologies effectively recognize various record types and generate record management metadata. This paper provides an overview of Korean NLP technologies and discusses considerations for applying NLP technology in records management. The process of using NLP technologies, such as machine translation and optical character recognition for digital conversion of records, is introduced as an example implemented in the Python environment. In contrast, a plan to improve environmental factors and record digitization guidelines for applying NLP technology in the records management field is proposed for utilizing NLP technology.

32
도슬기(한성대학교 디지털인문정보학트랙 강사) ; 박희진(한성대학교 디지털인문정보학트랙 부교수) 2023, Vol.23, No.2, pp.95-115 https://doi.org/10.14404/JKSARM.2023.23.2.095
초록보기
초록

본 연구는 세계기록유산으로 등재된 국채보상운동 디지털 아카이브 기록물의 활용성을 높이기 위한 방안으로 위키데이터와 연계하는 데이터 모델을 설계하고, 적용가능성을 검토하였다. 국채보상운동 기록물 메타데이터, 시소러스, 시맨틱 네트워크 그래프를 분석하여 시사점을 도출하고, 기록물의 내용 분석을 통해 위키데이터와 연계를 위한 데이터 모델의 클래스인 기록물건, 행위주체, 시간, 장소, 사건을 도출하였다. 또한 클래스 간 연결을 위한 관계 속성들을 파악하여, 설계한 데이터 모델을 실제 기록물 사례에 적용해봄으로써, 속성을 중심으로 한 객체 간의 이동을 통해 풍부한 관련 정보들을 획득할 수 있는 가능성을 확인하였다. 본 연구의 결과는 소규모 로컬 아카이브에서 위키데이터를 활용한 데이터의 공유와 활용 체계 마련에 활용될 수 있을 것이다.

Abstract

This study designed a data model linked to Wikidata and examined its applicability to increase the utilization of the digital archive records of the National Debt Redemption Movement, registered as World Memory Heritage, and implications were derived by analyzing the existing metadata, thesaurus, and semantic network graph. Through analysis of the original text of the National Debt Redemption Movement records, key data model classes for linking with Wikidata, such as record item, agent, time, place, and event, were derived. In addition, by identifying core properties for linking between classes and applying the designed data model to actual records, the possibility of acquiring abundant related information was confirmed through movement between classes centered on properties. Thus, this study’s result showed that Wikidata’s strengths could be utilized to increase data usage in local archives where the scale and management of data are relatively small. Therefore, it can be considered for application in a small-scale archive similar to the National Debt Redemption Movement digital archive.

초록보기
초록

고고학은 현재에 직접 관찰할 수 없는 과거의 인간 행위를 연구하는 학문이다. 따라서 과거의 물질문화와 정황을 기록하고 있는 데이터는 고고학 연구에 있어 매우 중요하다. 그럼에도 불구하고 우리나라에서 고고학 데이터를 위한 디지털 아카이브 개발에 관심을 가지고 개발의 필요성에 대해 주장하는 사람들은 별로 없다. 본 논문은 고고학 데이터와 그 데이터를 위한 디지털 아카이브의 중요성과 필요성에 대해 생각해봄으로써, 우리나라의 국가 고고학 데이터 디지털 아카이브 개발의 필요성을 인식하는 기회가 마련되었으면 하는 바람에서 시작되었다. 이를 위해 본 논문에서는 먼저 고고학의 학문, 데이터, 디지털 아카이브의 성격에 대해 간단하게 살펴보도록 하겠다. 다음 부분에서는 세계적으로 유명한 고고학 데이터의 디지털 아카이빙 사례를 살펴보도록 하겠다. 마지막으로 앞의 내용들을 고려하여 우리나라의 국가 고고학 데이터 디지털 아카이브 개발을 위한 제언을 하고자 한다.

Abstract

Because archaeological artifacts are often destroyed during physical excavation, the data archaeologists gather in the field is rich with research potential. Few in Korea have paid attention to digital archives for archaeological data or argued for their development. This paper considers the significance and necessity of archaeological data and digital archives for its preservation and access. It also raises awareness of the need to develop a Korean national archaeological data digital archive. The paper first overviews the nature of the archaeological discipline, data, and digital archives. Then it investigates well-known, global cases involving digital archiving of archaeological data. Based on these foundations, the paper discusses principal and prior challenges to developing a Korean national archaeological data digital archive.

초록보기
초록

전자기록물의 유형은 다양해지고 있으며, 기능성이나 사용자와의 상호작용을 포함하며 여러 종류의 전자기록으로 구성된 기록물인 복합전자기록물들이 증가하고 있다. 복합전자기록물의 지속적인 접근을 보장하기 위해서는 아카이빙을 지원할 수 있는 메타데이터 구축이 필수적이다. 본 연구는 이러닝 콘텐츠인 복합전자기록물의 아카이빙을 위한 메타데이터 요소를 설계하여 제안하였다. 국내외의 장기보존을 위해 설계된 포맷 레지스트리의 구성요소를 비교 분석하여 디지털 아카이빙에 필수적인 공통 메타데이터 요소를 도출하고, 간호 분야 이러닝 콘텐츠의 보존 속성을 조사, 분석하여 이를 반영할 수 있도록 메타데이터 요소를 확장, 추가하였다. 분석결과를 통해 복합전자기록물 아카이빙을 지원하는 메타데이터 상위요소 25개와 138개의 하위요소가 제안되었다.

Abstract

Electronic record types are becoming diverse, and “composite electronic records,” which are made up of various types of electronic records associated with functionality or user interaction that does not exist in current electronic document formats, are increasing. To ensure a continuous access to composite electronic records, metadata construction is a prerequisite for electronic records archiving. In this paper, we propose a metadata that can support archiving of composite electronic records associated with interactive functionality. The common elements were derived from an analysis of both domestic and international file format registry projects, and metadata elements related to functional requirements were identified from the analysis of the records on nursing education e-learning contents. We proposed the metadata elements for archiving composite electronic records, which consist of 25 high-level elements and 138 subelements.

35
이유경(중앙대학교 일반대학원 문헌정보학과 기록관리전공) ; 김학래(중앙대학교) 2020, Vol.20, No.4, pp.1-17 https://doi.org/10.14404/JKSARM.2020.20.4.001
초록보기
초록

정보기술의 발전에 따라 아카이브의 디지털화가 가속화되고 있다. 그런데 전통적인 방식의 디지털 아카이브는 기록을 효과적으로 검색하고 연계하고 이해하는 데 한계가 있다. 본 논문은 디지털 아카이브의 활용성을 극대화하기 위한 방안으로 관계 중심의 지식그래프 방식을 제안한다. 디지털 아카이브의 사례인 ‘1997 외환위기 아카이브’의 특징을 검토하고, 아카이브에 포함된 모든 개체와 개체 사이의 관계는 RiC-O(Records in Contexts-Ontology) 기반의 지식그래프로 구축한다. 본 연구의 결과인 외환위기 지식그래프는 1997 외환위기 아카이브의 모든 개체를 기계가 처리할 수 있는 형식으로 구축한다. 디지털 아카이브와 비교해 지식그래프 접근은 개체의 정보, 개체 사이의 관계를 정확히 탐색할 수 있고, 이를 통해 의미검색, 지능형 서비스에 활용될 수 있다.

Abstract

Along with the development of information technology, the digitalization of archives has also been accelerating. However, digital archives have limitations in effectively searching, interlinking, and understanding records. In response to these issues, this study proposes a knowledge graph that represents comprehensive relationships among heterogeneous entities in digital archives. In this case, the knowledge graph organizes resources in the archives on the Korean financial crisis of 1997 by transforming them into named entities that can be discovered by machines. In particular, the study investigates and creates an overview of the characteristics of the archives on the Korean financial crisis as a digital archive. All resources on the archives are described as entities that have relationships with other entities using semantic vocabularies, such as Records in Contexts-Ontology (RiC-O). Moreover, the knowledge graph of the Korean Financial Crisis of 1997 is represented by resource description framework (RDF) vocabularies, a machine-readable format. Compared to conventional digital archives, the knowledge graph enables users to retrieve a specific entity with its semantic information and discover its relationships with other entities. As a result, the knowledge graph can be used for semantic search and various intelligent services.

초록보기
초록

본 연구에서는 전자기록물을 전자기록생산시스템에서 기록관리시스템으로 이관할 때 발생되고 있는 디지털컴포넌트의 무결성 훼손 문제를 해결하고자 클라우드 저장소를 활용한 기록물의 논리적 이관 방안을 제안하였다. 생산단계에서부터 클라우드 저장소를 활용하여 전자기록물을 생산하고, 이를 기록관으로 이관하는 전자기록물의 논리적 이관 방식은 다음과 같은 장점을 가지고 있다. 첫째, 최근에 점차 확대되고 있는 클라우드 컴퓨팅 기술을 활용하여 공공기관의 업무방식에 효과적으로 적용할 수 있는 기록물관리 방안이다. 둘째, 전자기록물을 복사하여 물리적으로 이관하는 기존의 방식보다 논리적으로 보관권한 만을 이양함으로서 전자기록물의 이관 시 발생할 수 있는 각종 위험 요소를 줄일 수 있다. 셋째, 전자기록물의 물리적인 이관에 따른 디지털컴포넌트의 오류를 미연에 방지할 수 있어 전자기록물의 무결성을 보장할 수 있다. 넷째, 전자기록물의 이관업무 수행을 위해 낭비되고 있는 행정력과 비용을 절감할 수 있다.

Abstract

In this study, we propose a logical transfer method of records using cloud storage to solve the integrity problem of digital component, which is generated when electronic records are transferred from the electronic record production system to the record management system. This method, which produces electronic records using cloud storage from the production stage and transfers them to the archives, has the following advantages. First, as a record management method, it can be effectively applied in public institutions by utilizing cloud computing technology, which has been the trend recently. Second, unlike the existing method of copying and physically transferring electronic records, the proposed method can reduce various risk factors that may occur in the transfer of electronic records by logically transferring the storage. Third, the method can prevent errors of the digital component according to the physical transfer of the electronic record; hence, the integrity of the electronic record can be guaranteed. Fourth, administrative power and cost that are wasted because of the electronic transfer of electronic records can be reduced.

초록보기
초록

Abstract

This study investigates the current preservation and management of four records and documentary heritage in Korea that is in the UNESCO's Memory of the World Register. The study analyzes their problems and corresponding solutions in digitizing those world records heritages. This study also reviews additional four documentary books in Korea that are in the wish list to add to UNESCO's Memory of the World Register. This study is organized as the following: Chapter 2 examines the value and meanings of world records and documentary heritage in Korea. The registry requirements and procedures of UNESCO's Memory of the World Register are examined. The currently registered records of Korea include Hunmin-Chongum, the Annals of the Choson Dynasty, the Diaries of the Royal Secretariat (Seungjeongwon Ilgi), and Buljo- Jikji-Simche-Yojeol (vol. Ⅱ). These records heritage's worth and significance are carefully analyzed. For example, Hunmin-Chongum(「訓民正音」) is consisted of unique and systematic letters. Letters were delicately explained with examples in its original manual at the time of letter's creation, which is an unparalleled case in the world documentary history. The Annals of the Choson Dynasty(「朝鮮王朝實錄」) are the most comprehensive historic documents that contain the longest period of time in history. Their truthfulness and reliability in describing history give credits to the annals. The Royal Secretariat Diary (called Seungjeongwon-Ilgi(「承政院日記」)) is the most voluminous primary resources in history, superior to the Annals of Choson Dynasty and Twenty Five Histories in China. Jikji(「直指」) is the oldest existing book published by movable metal print sets in the world. It evidences the beginning of metal printing in the world printing history and is worthy of being as world heritage. The review of the four registered records confirms that they are valuable world documentary heritage that transfers culture of mankind to next generations and should be preserved carefully and safely without deterioration or loss. Chapter 3 investigates the current status of preservation and management of three repositories that store the four registered records in Korea. The repositories include Kyujanggak Archives in Seoul National University, Pusan Records and Information Center of National Records and Archives Service, and Gansong Art Museum. The quality of their preservation and management are excellent in all of three institutions by the following aspects: 1) detailed security measures are close to perfection 2) archiving practices are very careful by using a special stack room in steady temperature and humidity and depositing it in stack or archival box made of paulownia tree and 3) fire prevention, lighting, and fumigation are thoroughly prepared. Chapter 4 summarizes the status quo of digitization projects of records heritage in Korea. The most important issue related to digitization and database construction on Korean records heritage is likely to set up the standardization of digitization processes and facilities. It is urgently necessary to develop comprehensive standard systems for digitization. Two institutions are closely interested in these tasks: 1) the National Records and Archives Service experienced in developing government records management systems; and 2) the Cultural Heritage Administration interested in digitization of Korean old documents. In collaboration of these two institutions, a new standard system will be designed for digitizing records heritage on Korean Studies. Chapter 5 deals with additional Korean records heritage in the wish list for UNESCO's Memory of the World Register, including: 1) Wooden Printing Blocks(經板) of Koryo-Taejangkyong(高麗大藏經) in Haein Temple(海印寺); 2) Dongui-Bogam(「東醫寶鑑」) 3) Samguk-Yusa(「三國遺事」) and 4) Mugujeonggwangdaedaranigyeong(「無垢淨光大다羅尼經」). Their world value and importance are examined as followings. Wooden Printing Blocks of Koryo-Taejangkyong in Haein Temple is the worldly oldest wooden printing block of cannon of Buddhism that still exist and was created over 750 years ago. It needs a special conservation treatment to disinfect germs residing in surface and inside of wooden plates. Otherwise, it may be damaged seriously. For its effective conservation and preservation, we hope that UNESCO and Government will schedule special care and budget and join the list of Memory of the Word Register. Dongui-Bogam is the most comprehensive and well-written medical book in the Korean history, summarizing all medical books in Korea and China from the Ancient Times through the early 17th century and concentrating on Korean herb medicine and prescriptions. It is proved as the best clinical guidebook in the 17th century for doctors and practitioners to easily use. The book was also published in China and Japan in the 18th century and greatly influenced the development of practical clinic and medical research in Asia at that time. This is why Dongui Bogam is in the wish list to register to the Memory of the World. Samguk-Yusa is evaluated as one of the most comprehensive history books and treasure sources in Korea, which illustrates foundations of Korean people and covers histories and cultures of ancient Korean peninsula and nearby countries. The book contains the oldest fixed form verse, called Hyang-Ka(鄕歌), and became the origin of Korean literature. In particular, the section of Gi-ee(紀異篇) describes the historical processes of dynasty transition from the first dynasty Gochosun(古朝鮮) to Goguryeo(高句麗) and illustrates the identity of Korean people from its historical origin. This book is worthy of adding to the Memory of the World Register. Mugujeonggwangdaedaranigyeong is the oldest book printed by wooden type plates, and it is estimated to print in between 706 and 751. It contains several reasons and evidence to be worthy of adding to the list of the Memory of the World. It is the greatest documentary heritage that represents the first wooden printing book that still exists in the world as well as illustrates the history of wooden printing in Korea.

38
오정희(이화여자대학교 사회과학대학 기록관리학) ; 정연경(이화여자대학교) 2018, Vol.18, No.4, pp.99-124 https://doi.org/10.14404/JKSARM.2018.18.4.099
초록보기
초록

본 연구는 국가보훈처의 ‘공훈전자사료관’ 컬렉션을 기반으로 독립 운동 컬렉션에 대한 출처별, 주제별, 자료유형별 분류 체계를 제안하였다. 먼저 출처별 분류 체계는 계층별로 구성하였으며 출처별로 분류된 기록물들은 관련 주제어에 따라 2차 분류한 후, 17가지 자료유형별로 분류하였고 ‘출처-주제-자료유형’의 인용 순서로 기술하였다. 또한 주제어를 바탕으로 한 귀납적 방법을 이용하여 유의미한 컬렉션을 도출하였다. 이를 통해 공훈전자사료관 컬렉션을 출처별, 주제별, 자료유형별로 이용자가 기록물을 쉽게 찾을 수 있도록 분류하였다. 본 연구의 결과는 독립 운동 DB 자료의 기록물 검색을 지원하기 위한 분류 체계로서 이용자의 접근성을 높이고 독립 운동 기록물 서비스를 확장하는데 기초가 될 것이다.

Abstract

This study suggests the development of a classification system for the Independent Movement Records of the Ministry of Patriots and Veterans Affairs based on the collection of Gonghun Digital Archive based on sources, subjects, and media types. First, the classification system by source is organized by hierarchy, and the records classified by source are classified into the second category based on the related keyword. Then, the records are classified into 17 media types. Finally, it is described in the citation order of “source-subject-media type.” In addition, a meaningful collection using inductive methods based on the subject words is derived. Finally, Gonghun Digital Archive collections are categorized by media types, sources, and subjects so that users can easily find the records. The result of this study is a classification system to support records retrieval of an independent movement collection, and it will become a basis for expanding the accessibility of the user and the service of independent movement records.

초록보기
초록

지난 몇 년 사이에 전자문화, 전자정부, 전자학습 및 전자 비즈니스의 디지털 아카이브즈들은 세계적으로 순조롭게 성장해 왔다. 우리가 이 아카이브즈들을 구축하고 관리하기 위해 상당한 시간과 노력을 투자해온 한편, 이 처리에 의해서 생산된 디지털 레코드들을, 미래의 기술로도 접근할 수 있게 하고, 사람들로 하여금 그것이 확실하고 신뢰할 수 있는 것인지 결정할 수 있게 하면서, 정보 기술의 여러 세대 전체에서 모두 이용할 수 있게 하는 능력은 갖지 못한다. 이것은 아직 솔루션이 개발되지 않은 심각한 문제이다. 이 논문은 디지털 아카이브즈와 보존이 성공하기 위한 실용적 기술에 대하여 논하고, 이 중요한 문제를 해결하기 위해 정보의 생명주기의 일반적 구조를 기술하여, 정량적 방법과 증진되는 방식으로 분석되고 평가될 수 있는, 디지털 레코드들을 보존하기 위한 타당한 방법을 발견할 수 있도록 한다.

Abstract

The digital archives of E-culture, E-government, E-learning, and E-business have grown by leaps and bounds worldwide during the last several years. While we have invested significant time and effort to create and maintain those archives, we do not have the ability to make digital records generated by the processes all available across generations of information technology, making it accessible with future technology and enabling people to determine whether it is authentic and reliable. This is a very serious problem for which no solutions have been devised yet. This paper discusses practical technologies for digital archives and preservation to succeed, and describes a general framework of the life cycle of information to address this important problem so that we may find reasonable ways to preserve digital records that can be analyzed and evaluated in quantitative measures and incremental manners.

초록보기
초록

디지털 아카이브는 디지털 자원을 보존하고 지속적으로 활용하기 위한 전자화된 저장소이다. 디지털 아카이브에 대한 이론적 연구는 활발하게 진행되고 있고, 다양한 도메인의 디지털 자원을 기록하기 위한 아카이브가 구축되어 서비스되고 있다. 그러나 디지털 아카이브의 자원은 디지털화라는 본래의 목적은 만족할 수 있지만, 자원의 검색과 재사용에 있어 여전히 제한이 있는 것이 현실이다. 본 연구는 FAIR 데이터 원칙을 자세히 살펴보고, 디지털 아카이브에 적용하기 위한 성숙도 평가 프레임워크를 제안한다. FAIR 데이터 원칙은 디지털 자원을 기계가 읽고 처리할 수 있게 만드는 일련의 지침으로 웹에 존재하는 모든 자원을 대상으로 적용할 수 있다. FAIR 데이터 원칙의 평가 모델은 계획 수립과 적용 단계를 구분해서 정의하고 있다. 그러나, 개별 원칙의 적용 여부를 평가하기 위한 명확한 기준이 모호하고, 디지털 아카이브 분야를 위한 평가 기준에 대한 논의가 미흡하다. 본 연구는 디지털 아카이브에 FAIR 데이터 원칙을 적용하기 위한 프레임워크를 제안하고, 향후 적용을 위한 이슈를 논의한다.

Abstract

Digital archives are electronic storages used to preserve and utilize digital resources sustainably. Theoretical research on digital archives is being conducted actively, and digital archives for recording various resources in heterogeneous domains are being built and serviced. However, although the original purpose of digitizing the resources of digital archives is achievable, the discovery and reuse are still limited. This study examines the Findable, Accessible, Interoperable, and Reusable (FAIR) data principles in detail and proposes a maturity assessment framework for digital archives. The FAIR Data Principles is a set of guidelines that enable machines to read and understand digital resources that are applied to any online resource. The evaluation model of the FAIR data principle defines the planning and application stages separately. However, criteria for evaluating the application of individual principles are still ambiguous, and discussions on evaluation criteria for the field of digital archives are insufficient. This study proposes a framework for applying the FAIR data principle to digital archives and discusses issues for future application.

한국기록관리학회지