연구 내용 |
l 센터소개 l 연구목표 |
* 연구목표를 달성하기 위한 세부 연구내용은 다음과 같은 주제들로 구성된다.
- 다국어 문서의 감성 분석을 위한 코퍼스 구축 및 평판 분석 연구
- 다국어 평판ㆍ관심 도메인 및 키워드별 데이터 분석과 태그셋 개발
- 다국어 활용형 감성사전 구축 방법론 개발 및 핵심 데이터 구축
- 다국어 감성 주석 코퍼스 반자동 구축 방법론 연구 및 데이터 구축
* 대용량 다형 데이터의 체계적 표현 및 학습, 분산 처리 연구
- 다국어 감성 분석을 위한 기초 웹 데이터 수집 및 정제 환경 구축
- Shallow 기계학습을 이용한 평판분석 테스트베드 구축
- 대용량 데이터 저장을 위한 병렬화 및 고속 저장기술 개발
Global Multi-modal Knowledge Research Center develops the linguistic resources and techniques for opinion analysis. Based on preliminary studies on multilingual linguistic properties, we develop semi-automatic methodologies to construct annotated corpora amd sentiment dictionaries. As engineering research, we have built up a testbed for crawing and cleaning a huge amount of multilingual data on the world-wide web. Also, we have established a learning system based on a shallow machine learning technique. In addition, we develop parallel and high-performance storage techniques for large-scale data storing and retrieval.