우리대학 지식출판콘텐츠원(원장 고윤성)은 2022년 한국지능정보사회진흥원(이하 ‘NIA’) 인공지능학습용 데이터 구축사업에서 총 96억 원 규모의 사업을 수주하였다. 이는 작년 NIA 인공지능학습용 데이터 구축사업에서 총 42억 규모를 수주한 데 이어 2년 연속 선정되었으며, 사업 규모도 대폭 확대된 쾌거라고 할 수 있다.
우리대학 지식출판콘텐츠원은 우리대학 데이터센터 책임연구원 한승희 특임강의교수(통번역대학원)와의 협업을 통해 NIA로부터 총 96억 규모의 ‘인공지능 학습용 데이터 구축’ 사업(지정 12번, 16번 과제)을 수주함으로써 데이터 특화 콘텐츠 관련 분야에 성과를 올렸다.
이번에 지식출판콘텐츠원에서 수주한 사업은 첫번째, 12번 교육용 한국인의 다국어 음성 데이터 구축(52.08억) 과제(영어(1,000시간), 중국어(500시간), 일본어(500시간), 영·중·일 제외 외국어(1,000시간))와 두번째, 16번 자연어 이해 및 생성 능력 검증 데이터 구축(44.72억) 과제는 발화유형(문어/구어/채팅)별 총 9만 문장 쌍(한-영/중/일), 자연어 분석 후처리용 과교정 검증 데이터, 기계번역 품질 검증 데이터 구축을 목표로 한다. 구축된 데이터는 지식출판콘텐츠원 및 데이터센터에서 보관하여 교육용 인공지능 모델, 외국어 음성 인식기 개발 등에 활용될 예정이다.
고윤성 지식출판콘텐츠원장은 "지식출판콘텐츠원은 수년간 쌓은 노하우를 바탕으로 우리대학 고유의 언어적 특성을 바탕으로 하는 융복합 역량을 발전시키는 데 이바지해오고 있다. 앞으로도 데이터센터와의 협업을 통해 외대형 융복합 비즈니스 모델 구축 분야를 더 적극적으로 수행할 것으로 기대한다"라고 전했다.