공공기관 유튜브 동영상 아카이빙을 위한 메타데이터 핵심 요소 연구
- Abstract
- 유튜브는 영상자료 공유를 위한 콘텐츠 유통 플랫폼의 역할뿐만 아니라 다양한 정보를 입수하는 경로로 활용되고 있다. 국내의 경우 유튜브 이용시간은 다른 소셜미디어 유형(트위터, 페이스북 등)에 비해 월등히 높다. 또한 정보검색에 있어서도 유튜브는 상위권에 위치한다. 대다수의 공공기관은 유튜브를 기관 홍보의 도구로 사용하고 있다. 이처럼 공공기관에서 유튜브를 운영하는 것은 공적인 업무로 바라볼 수 있으며, 유튜브에 업로드된 동영상은 공적 업무 수행의 결과물로 볼 수 있다.
공공기관은 유튜브 동영상을 통해 국민과 소통할 수 있다. 양방향 소통이 가능하다는 점과 이 결과가 기록으로 남는다는 점에서 소셜미디어는 기록으로서 가치가 높다고 할 수 있다. 유튜브에 영상을 업로드하는 행위 자체와 더불어 영상 속에서 사용하는 자막, 유행어를 통해 당시 사회의 트렌드를 파악 할 수 있다. 또한 댓글 속에서 구축된 공론의 장은 사회, 문화적인 특징을 발견할 수 있는 중요한 수단이다. 영상기록으로서 유튜브 동영상은 같은 내용의 텍스트 기록보다 이용자들의 이해가능성을 높여줄 수 있다. 이런 점을 감안하면 공공기관의 유튜브 동영상은 하나의 디지털 공공기록물로서 관리 및 보존해야한다는 필요성이 제기된다. 즉, 유튜브 동영상을 아카이빙하여 가치 있는 동영상을 보존하고 관리해야 한다. 이 경우 동영상 자체와 동영상을 설명해주는 메타데이터를 함께 아카이빙 해야 한다. 하지만 현재 유튜브 동영상 아카이빙을 위한 메타데이터는 찾기 어렵고, 관련 연구도 부족하다. 이에 본 연구는 공공기관의 유튜브 동영상을 아카이빙 하기 위한 메타데이터를 설계하고, 핵심 요소를 선정하는 것을 목적으로 한다.
이를 위해 국내 기록관리 메타데이터 표준인 NAK 8:2021(v2.2)과 국제 보존 메타데이터 표준인 ISAD(G), PREMIS, 방송, 영상 메타데이터 표준인 PBCore를 살펴보았으며, 유튜브에 영상을 등록하고 이용 시 생성되는 정보(유튜브 메타데이터)들을 조사하였다. 이후 선행연구를 통해 종합한 아카이빙 메타데이터 구조를 토대로 조사한 메타데이터 요소들을 매핑하였다. 그 결과 5개 메타데이터 영역과 10개 하위 영역으로 구성된 유튜브 동영상 아카이빙을 위한 메타데이터를 설계하였다. 5개 메타데이터 영역은 설명 메타데이터, 구조 메타데이터, 관리 메타데이터, 보존 메타데이터, 이용자 참여 메타데이터로 구분된다. 하위 영역은 설명 메타데이터의 설명 영역, 구조 메타데이터의 구조 영역, 관리 메타데이터의 권리, 관리, 기술 영역, 보존 메타데이터의 출처, 참조, 문맥, 인증 영역, 이용자 참여 메타데이터의 이용자 참여 영역으로 세분화하였다.
설계한 메타데이터에 대해 평가를 받기위해 디지털 아카이빙 또는 메타데이터 업무 관련 경험 및 연구 경험이 있는 15명의 전문가를 통해 설문조사를 실시하였다. 설문지는 일반현황과 전체 메타데이터 요소 63개에 대해 5점 리커트 평가 방법, 추가 요소 및 기타의견으로 구성되었다. 설문지는 15부를 배포하여 14부(93%)를 회수하였다. 또한 데이터 정제 작업을 실시하여 설문지 문항 ‘1.1 소속기관 유형’을 공공기관, 기타기관, 대학별로 정제하였다.
본 연구는 기술 통계 분석을 수행하였다. 빈도분석과 평균분석으로 구분하였는데, 빈도분석을 통해 응답자의 소속기관 유형, 최종학력, 경력 사항을 분석하였고, 평균분석을 통해 5점 리커트 평가 결과에 대한 데이터의 최솟값, 중위값, 최댓값, 평균값, 표준편차에 대해 분석하였다. 기술 통계 분석에 대한 결과는 다음과 같다. 첫째, 빈도 분석을 실시한 결과는 다음과 같다. 응답자 소속기관은 공공기관 9명(64%), 기타기관 4명(29%), 대학 1명(7%)으로 나타났다. 최종학력에 대한 응답은 박사(수료 포함) 6명(42.86%), 석사 4명(28.57%), 학사 4명(28.57%)으로 나타났다. 경력 사항 응답에 대해서는 한 명이 미응답하여, 13명으로 분석한 결과 0~5년이 3명(23%), 6~10년이 4명(31%), 11~15년이 2명(15%), 그 이상이 4명(31%)으로 나타났다.
둘째, 평균값을 중심으로 한 기술 통계 분석의 결과는 다음과 같다. 설명 메타데이터의 설명 영역 요소 중 ‘제목’은 전체 메타데이터 요소에서 모든 응답자들에게 5점(매우 적절)을 받은 유일한 요소로 나타났다. 이에 따라 ‘제목’ 요소는 더 이상의 분석 없이 핵심 요소로써 유의미한 결과가 나타났다. 구조 메타데이터의 구조 영역의 응답 결과에서 ‘재생시간’ 요소의 평균값이 제일 높았으며 ‘URL’, ‘프레임 비율’, ‘비디오 ID’ 순으로 나타났다. 평균값이 제일 낮은 요소는 ‘장르’로 나타났다. 관리 메타데이터의 권리 영역, 관리 영역, 기술 영역의 응답을 종합한 결과는 ‘공개 구분’ 요소의 평균값이 세 영역에 속한 요소들 중 제일 높았으며 다음으로 ‘생산일시’, ‘등록일시’, ‘파일크기’, ‘포맷명’, ‘공공저작물여부’, ‘공공저작물자유이용허락표시유형’ 순으로 나타났다. ‘관리 행위자’ 요소는 전체 메타데이터 요소에서 평균값이 가장 낮은 요소로 나타났다. 보존 메타데이터의 출처 영역, 참조 영역, 문맥 영역, 인증 영역의 응답을 종합한 결과는 ‘소장처’ 요소의 평균값이 네 영역에 속한 요소들 중 제일 높았으며 다음으로 ‘원본의 존재와 위치’, ‘기관명’, ‘소장 위치’ 순으로 나타났다. 이용자 참여 메타데이터의 경우 평균값이 높은 요소는 ‘조회수’, ‘좋아요수’ 순으로 나타났으며, ‘대댓글 ID’ 요소의 평균값이 가장 낮은 것으로 나타났다.
셋째, ‘추가 요소 및 기타 의견’은 7명이 응답하였다. 추가 요소 응답에서는 “채널 이름”, “구독자 수”, “콘텐츠 활용 연령”, “삭제” 요소라고 응답하였으며, 기타 의견 응답에서는 “보존 메타데이터의 추가 요소 필요”, “상, 하위 요소의 불명확성과 필수/선택 조사 여부”, “아카이빙 기준 제시”라고 응답하였다.
다음으로 타당도 검증과 신뢰도 검증을 진행하였다. 타당도 검증은 요인분석 방법으로 이루어졌고, 신뢰도 검증은 크론바흐 알파값을 활용하였다. 핵심 요소 선정방법은 타당도 검증과 신뢰도 검증의 기준값을 모두 충족하는 요소로 선정하였다. 타당도 검증과 신뢰도 검증 결과는 다음과 같다.
첫째, 해당 설문 응답에 대한 5개의 메타데이터의 10개 하위 영역별로 타당성 검증과 신뢰도 검증을 진행하였다. 각 하위 영역별로 요인분석이 적합한지 알아보고자 KMO 및 Bartlett의 구형성 검증을 실시한 결과, KMO>0.5, Bartlett의 p<0.05를 만족하지 못한 영역은 관리 메타데이터의 권리 영역이 나타났다. 보존 메타데이터의 출처 영역은 요소가 한 개(‘수집, 이관의 직접적 출처’)만 존재하기 때문에 요인분석을 할 수 없었으며, 참조 영역은 요인분석 결과 추출되는 값이 존재하지 않았다.
둘째, 요인분석 결과는 다음과 같다. 설명 메타데이터의 설명 영역에서는 ‘제목’ 요소를 제외하고 나머지 요소들만 요인분석을 실시한 결과 ‘언어’, ‘설명’, ‘범주’가 추출 공통성 값과 성분 수치의 기준값을 충족하였다. 구조 메타데이터의 구조 영역에서는 ‘프레임 비율’, ‘데이터 전송 속도’, ‘재생시간’, ‘압축’, ‘인코딩 정보’만이 공통성 값과 성분 수치가 기준값을 충족하였다. 관리 메타데이터의 관리 영역에서 추출 기준값을 충족한 요소는 ‘관리일시’, ‘관리행위자’, ‘변경요소’, ‘생산일시’, ‘관리설명’, ‘관리유형’으로 나타났다. 기술 영역에서는 ‘생성 어플리케이션 명’, ‘생성 어플리케이션 버전’, ‘운영시스템’, ‘포맷버전’으로 나타났다. 모든 요소가 추출 기준값을 충족한 영역은 보존메타데이터의 문맥 영역(‘관계대상식별자’, ‘관계유형’, ‘관계설명’)과 인증 영역(‘무결성체크법’, ‘서명’, ‘무결성체크값’), 이용자 참여 메타데이터의 이용자 참여 영역(‘조회수’, ‘좋아요수’, ‘싫어요수’, ‘댓글수’, ‘댓글ID’, ‘댓글내용’, ‘대댓글ID’, ‘대댓글내용’)으로 나타났다.
셋째, 타당성 검증 기준값을 충족한 요소들에 한해서 메타데이터별, 영역별로 신뢰도 검증을 실시하였다. 그 결과 모두 0.7 이상으로 확인되어 매우 바람직한 것으로 나타났으며, 해당 요소들은 핵심 요소로써 유의한 결과가 나타났다고 할 수 있다.
본 연구에서 설계한 메타데이터는 5개 메타데이터의 10개 영역에 포함되는 63개의 측정요소로 구성되었다. 이 중에서 타당성 검증과 신뢰도 분석을 통해 핵심 요소로써 유의한 결과가 나타난 요소는 5개 메타데이터의 7개 영역에 포함되는 33개 요소로 나타났다. 이에 따른 메타데이터별, 영역별, 측정요소별 채택률은 각각 100%, 70%, 53%로 나타났다.
본 연구에서 메타데이터 요소 도출을 위해 연구 대상으로 선정한 유튜브 동영상이 소셜미디어 유형 전체의 동영상을 대표한다고 보기 어려울 수 있다. 또한 핵심 요소 도출을 위해 실시한 요인분석의 결과를 가지고 핵심 요소의 여부를 판단하는 것은 어렵다는 한계점이 존재한다. 하지만 본 연구는 다양한 메타데이터 연구 중 소셜미디어 동영상을 아카이빙하기 위한 메타데이터의 초기 연구로서 의의가 있으며, 유튜브 동영상을 기록으로 접근했다는 점은 다른 메타데이터 연구와 차별화를 가진다고 볼 수 있다. 향후 다양한 후속 연구를 통해 소셜미디어 메타데이터 대한 요소가 다양화된다면 대규모 집단을 대상으로 한 확인적 요인분석 등 방법이 가능하리라 본다.
기록관리의 궁극적인 목적은 기록의 활용이라고 할 수 있다. 유튜브 기록 역시 아카이빙을 통해 이용자에게 서비스를 제공하고, 수집된 데이터를 통해 유의미한 현상을 파악함으로써 해당 기록의 가치를 높일 수 있다. 본 연구는 유튜브 동영상 기록물의 아카이빙에서 메타데이터에 주목했으며, 후속 연구를 통해 다양한 연구가 진행되기를 바란다.
- Author(s)
- 김락근
- Issued Date
- 2022
- Awarded Date
- 2022-08
- Type
- Thesis
- Keyword
- 공공기관; 소셜미디어 기록; 유튜브 기록; 아카이빙; 메타데이터; 핵심 요소
- URI
- http://dspace.hansung.ac.kr/handle/2024.oak/6447
- Authorize & License
-
- Files in This Item:
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.