바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: records categorization, 검색결과: 2
초록보기
초록

기록물은 과거와 현재를 포함하는 시간적 특성, 특정 언어에 제한되지 않는 언어적 특성, 기록물이 갖고 있는 다양한 유형을 복합적으로 갖고 있다. 기록물의 생성, 보존, 활용에 이르는 생애주기에서 텍스트, 영상, 음성으로 구성된 데이터의 처리는 많은 노력과 비용을 수반한다. 기계번역, 문서요약, 개체명 인식, 이미지 인식 등 자연어 처리 분야의 주요 기술은 전자기록과 아날로그 형태의 디지털화에 광범위하게 적용할 수 있다. 특히, 딥러닝 기술이 적용된 한국어 자연어 처리 분야는 다양한 형식의 기록물을 인식하고, 기록관리 메타데이터를 생성하는데 효과적이다. 본 논문은 한국어 자연어 처리를 기술을 소개하고, 기록 관리 분야에서 자연어 처리 기술을 적용하기 위한 고려사항을 논의한다. 기계번역, 광학문자인식과 같은 자연어 처리 기술이 기록물의 디지털 변환에 적용되는 과정은 파이썬 환경에서 구현한 사례로 소개한다. 한편, 자연어 처리 기술의 활용을 위해 기록관리 분야에서 자연어 처리 기술을 적용하기 위한 환경적 요소와 기록물의 디지털화 지침을 개선하기 위한 방안을 제안한다.

Abstract

Records have temporal characteristics, including the past and present; linguistic characteristics not limited to a specific language; and various types categorized in a complex way. Processing records such as text, video, and audio in the life cycle of records’ creation, preservation, and utilization entails exhaustive effort and cost. Primary natural language processing (NLP) technologies, such as machine translation, document summarization, named-entity recognition, and image recognition, can be widely applied to electronic records and analog digitization. In particular, Korean deep learning–based NLP technologies effectively recognize various record types and generate record management metadata. This paper provides an overview of Korean NLP technologies and discusses considerations for applying NLP technology in records management. The process of using NLP technologies, such as machine translation and optical character recognition for digital conversion of records, is introduced as an example implemented in the Python environment. In contrast, a plan to improve environmental factors and record digitization guidelines for applying NLP technology in the records management field is proposed for utilizing NLP technology.

초록보기
초록

본 연구는 해방촌 니트 사업을 주제로 수집된 구술 기록의 주제 접근을 위해 패싯을 기반으로 한 주제명표목의 개발 방안을 제안하는데 목적이 있다. 첫째, 문헌 연구에서 구술 기록과 그 내용의 개념과 특징을 고찰하고 구술 내용에 대한 패싯과 주제명표목의 적용 의미를 살펴보았다. 둘째, 구술의 서사적 측면을 반영한 육하원칙을 토대로 구술 기록에 대한 기본 패싯을 설정하였다. 셋째, 해방촌 니트 사업의 종사자와 관계자 7인과 면담자 1인의 구술 면담을 통해 수집된 녹취록을 대상으로 용어 분석을 진행하였고, 그 결과 540개의 주제어를 선정하고 패싯에 따라 범주화하였다. 마지막으로 패싯으로 구분한 주제어를 주제명표목의 표목으로 활용하여 관계어와 함께 작성하였다. 본 연구는 구술 기록의 내용에 대한 주제적 접근과 활용에 기여할 수 있을 것이다.

Abstract

This study develops a methodology for facet-based subject headings for the subject access to oral history records collected by such a project of the knit business in Haebangchon. First, the concept and characteristics of oral history records and their contents were investigated, and the meaning of facets and subject headings applied to such content was examined in the literature review. Second, the basic facets of oral history records were created based on 5W1H that reflected the narrative feature of oral history. Third, 540 subject-related terms were selected through an analysis of the transcript written based on oral history interviews with one interviewer and seven interviewees linked to the knit business in Haebangchon. Fourth and last, subject headings were proposed with the selected subject-related terms categorized in facets with various relationships. These facet-based subject headings will improve the subject access and use of oral history records.

한국기록관리학회지