바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 메타데이터 검증, 검색결과: 5
1
최주호((주)세미콘네트웍스) ; 이재영((주)세미콘네트웍스) 2012, Vol.12, No.1, pp.7-32 https://doi.org/10.14404/JKSARM.2012.12.1.007
초록보기
초록

전자기록물의 이관할 때, 전자기록물의 필수 메타데이터의 검증과 실제 문서에 있는 메타데이터를 이용한 검증도 중요하다. 본 연구에서는 전자기록물에 포함된 다양한 형식의 전자파일 중에서 본문파일에서 메타데이터를 추출하고 항목별로 분류한 후 이관되는 메타데이터 항목과 비교 검증을 위한 기술 개발을 연구하였다. 해외에서 개발된 추출 도구와 달리 국내 전자결재 형식을 감안하여 첨부된 본문파일에서 메타데이터를 추출하는 기술을 개발하였으며, 기록물 문서 메타항목에 저장된 원 메타데이터와 추출 메타데이터간 비교 검증을 수행하는 도구를 개발하였다.

Abstract

When migrate electronic records, the validation of the required metadata in electronic records and verified with the metadata in the document are also important. This paper presents a method and implements a tool to extract data from files in various formats and use them to validate metadata associated with the files in electronic records. Compared to other metadata extraction tools, especially developed in foreign countries, the standard form of documents used in Korean government is taken into account and metadata is extracted from the content of files. The tool compares the extracted data to encapsulated metadata for validation.

초록보기
초록

공공기관의 유튜브 동영상은 디지털 공공기록물로서 관리 및 보존이 필요하다. 이때 동영상 자체와 동영상을 설명하는 메타데이터도 함께 보존해야한다. 본 연구의 목적은 공공기관이 유튜브에 발행한 동영상을 아카이빙할 때 필요한 핵심 메타데이터 요소를 선정하는 것이다. 이를 위해 NAK 8, PREMIS, ISAD(G), 유튜브 메타데이터를 참조하여 설명, 구조, 관리, 보존, 이용자 참여의 5개 상위 영역, 10개 하위 영역의 메타데이터 요소를 설계하였다. 이후 14명의 전문가를 대상으로 설계한 메타데이터 요소를 검증하였다. 마지막으로 평가 결과에 대한 타당도 검증과 신뢰도 검증을 진행하였다. 타당도와 신뢰도 검증의 기준값을 모두 만족하는 요소는 63개 측정 요소 중 33개 요소로 확인되었다. 해당 요소들을 공공기관 유튜브 동영상 아카이빙을 위한 메타데이터 핵심 요소로 선정하였다.

Abstract

YouTube videos of public institutions are digital public records that need to be managed and preserved. As such, the video and the metadata describing the video should also be preserved. This study aims to select the key metadata elements necessary for archiving videos published on YouTube by public institutions. To this end, five high-level areas, namely the description, structure, management, preservation, and user participation, and the metadata elements of 10 subareas, were designed by referring to NAK 8, PREMIS, ISAD(G), and YouTube metadata. Afterward, the metadata elements designed by 14 experts were verified. Lastly, the validity and reliability of the evaluation results were verified. Of the 63 elements, 33 satisfied the validity and reliability criteria. Thus, these elements were selected as the core metadata for archiving YouTube videos in public institutions.

초록보기
초록

연구데이터의 연구의 정확성이나 신뢰성 확보를 위한 정보적 가치, 연구의 재현 또는 검증, 재사용 가능성을 연구데이터에 대한 체계적 관리가 강조되고 있다. 표준 메타데이터는 연구데이터 생산, 관리, 구조화, 기탁된 데이터 추출에 핵심 역할을 수행할 것이다. 연구데이터는 연구, 연구데이터, 데이터셋, 파일 등 다양한 계층적 관계를 가지고 있으며, 인용 및 연구성과 등의 엔터티와 연계되어 있다. 이에 본 연구에서는 연구데이터 관리를 위한 온톨로지 모델을 제시하고자 한다. NTIS 사례를 제시하여 연구의 적용가능성을 제시하였다. 이를 위해 기존 연구데이터 관련 선행연구, 메타데이터 표준의 분석, 연구데이터 리포지터리 사례조사를 실시하였다.

Abstract

The systematic management of research data is vital because it increases research data’s value for research reproduction, verification, and reusability. Standard metadata will play a key role in research data registration, management, and data extraction. Research data has various structural relationships, such as research, research data, data sets, and files, and associated with entities such as citations and research results. The study proposes an ontology model for research data management. It also suggests the application of ontology to NTIS. Previous studies, metadata standard analyses, and research data repository case studies were conducted.

4
박하람(중앙대학교 일반대학원 문헌정보학과 문헌정보학전공) ; 김학래(중앙대학교) 2021, Vol.21, No.3, pp.61-78 https://doi.org/10.14404/JKSARM.2021.21.3.061
초록보기
초록

일본군 ‘위안부’에 대한 기록은 민간 기관에서 개별적으로 관리하고 있다. 일부 기록은 디지털 아카이브로 구축되어 온라인으로 접근할 수 있다. 그러나, 디지털 아카이브의 기록은 기관에 따라 메타데이터의 구성과 표현 방식이 다르다. 한편, 기록 사이의 관계를 정의할 수 있는 체계가 미흡하기 때문에, 현재 구축된 일본군 ‘위안부’ 기록은 서로 연결되지 않고 파편적인 형식으로 남아있다. 본 연구는 일본군 ‘위안부’ 디지털 기록을 연계하기 위한 지식 모델을 제안하고, 분산화된 디지털 아카이브의 기록을 통합하여 일본군 ‘위안부’ 지식그래프를 구축한다. 일본군 ‘위안부’ 디지털 아카이브의 메타데이터를 분석하여 공통 요소를 도출하고, 표준 어휘를 적용하여 디지털 기록의 다양한 개체와 개체 사이의 관계를 의미적으로 표현한다. 특히, 흩어져 있는 기록을 연계하고 검색하기 위해 수집한 데이터의 정제가 이루어지고, 외부 데이터를 활용하여 기록의 맥락 정보를 강화하고 있다. 구축된 지식그래프의 검증은 분산된 기록의 탐색 여부를 측정하는 질의를 통해 수행된다. 검증 결과, 지식그래프는 흩어져 있는 기록을 연계하여 검색할 수 있고, 외부데이터로부터의 강화로 기록의 맥락 정보를 풍부하게 제공하며, 의미 기반의 검색을 통해 사용자의 의도에 맞춘 정확한 검색이 가능하다.

Abstract

Records on Japanese “Comfort Women” have been individually managed by private sectors or institutions, and some are provided as digital archives on the Internet. However, records of digital archives differ in the composition and representation of metadata by individual institutions. Meanwhile, there is a lack of a consistent structure to describe the relationships between and among these records, leading to their fragmentation and disconnectedness. This paper proposes a knowledge model for interlinking the digital archival resources and builds a knowledge graph by integrating the records from distributed digital archives. It derives common elements by analyzing metadata from the diverse digital archives and expresses them in standard vocabularies to semantically describe multiple entities and relationships of the digital archival resources. In particular, the study includes the refinement of collected data to search and thread dispersed records and the enrichment of external data to provide significant contextual information of records. An evaluation of the knowledge graph is performed via a query measuring the (dis)connectivity between the distributed records. As a result, the knowledge graph is capable of interlinking and retrieving fragmented records, providing substantial contextual information on the records with external data enrichment, and searching accurately to match the user’s intentions through semantic-based queries.

5
박하람(중앙대학교 일반대학원 문헌정보학과 문헌정보학전공 박사과정) ; 김학래(중앙대학교 사회과학대학 문헌정보학과 교수) 2023, Vol.23, No.4, pp.159-178 https://doi.org/10.14404/JKSARM.2023.23.4.159
초록보기
초록

디지털 아카이브는 지속적으로 보존할 가치가 있는 디지털 기록을 보존하고 활용하기 위한 온라인 플랫폼이다. 그러나 국내에서 운영되고 있는 디지털 아카이브는 기능, 메타데이터, 데이터의 기술원칙과 관련된 공통 원칙이 존재하지 않는다. 이는 분산적으로 존재하는 디지털 기록을 연계하기 힘들게 만드는 요인이 된다. 본 연구는 디지털 기록의 상호운용을 개선하기 위한 방안으로 디지털 아카이브를 위한 공통 어휘를 제안하고, 공통 어휘로 구축된 디지털 아카이브의 상호운용성을 평가한다. 1997 외환위기 아카이브의 데이터를 수집·분석하여 지식그래프를 구축하고, RiC-O로 구축된 지식그래프와 상호운용성을 비교한다. FAIR 데이터 원칙의 평가 프레임워크는 1997 외환위기 아카이브와 지식그래프를 평가하는 데 활용된다. 구축된 지식그래프는 기록의 다양한 개체가 서로 연계되고, 기록의 이해에 도움이 되는 맥락 정보를 제공한다. 검증 결과는 공통 어휘로 구축된 지식그래프가 기존 아카이브에 비해 디지털 기록의 연계와 검색, 상호운용 관점에서 향상된 결과를 보인다.

Abstract

A digital archive is an online platform for preserving and utilizing digital records worthy of continued preservation. However, there are no shared standards for functionality, metadata, or data technical principles across digital archives in Korea. These issues create challenges in linking distributed digital records. This study proposes a common vocabulary for digital archives to enhance the interoperability of digital records and evaluates the interoperability of the digital archive built with the common vocabulary. We collect and analyze data from the digital archive on the Korean financial crisis of 1997 to construct a knowledge graph and compare its interoperability with the knowledge graph built with RiC-O. The archive and the knowledge graph underwent evaluation using the FAIR data principles evaluation framework. The constructed knowledge graph links various objects in the archive and provides contextual information to aid in understanding the archive. The results demonstrate that a knowledge graph built with a common vocabulary significantly improves the linkage, search, and interoperability of digital records compared to a traditional archive.

한국기록관리학회지