한국어  English

음성인식 / 음성처리 / 오디오신호처리

    멤버   강의   연구   과제   논문   세미나   갤러리   뉴스

 

인간친화형 음성대화 응용을 위한 음성 감성 인식 및 유창성 평가 (Speech Emotion Recognition and Fluency Evaluation for Human-Friendly Spoken Dialog Applications) (2012-2015)

최근 애플사 아이폰의 시리(Siri)와 같이 다양한 음성대화 인터페이스가 개발되고 있다. 하지만 현재의 음성 인간-컴퓨터 상호작용(HCI)에서는 언어적인 정보만을 사용하며, 사용자의 감성, 유창성 수준, 연령 등의 비언어적 정보는 무시하고 있다. 본 과제는 인간친화적인 음성 HCI를 구현하기 위하여 음성대화로부터 사람의 감성을 인식하고 대화의 유창성을 평가하는 기반 기술 및 응용을 개발하고자 한다.

 

이동 기기의 강인한 음성 인터페이스를 위한 위상 기반 음성 처리 (Phase-Based Speech Processing for Robust Speech Interface to Mobile Devices) (2010-2013)

음성인식 기술은 이동기기의 편리한 음성 인터페이스 및 자연스러운 인간-로봇 상호작용(HRI)을 위하여 필수적이다. 이동기기와 지능로봇의 실제 사용 환경은 여러 가지 다른 음원, 배경잡음, 반향음이 존재하기 때문에, 음성 분리 기술을 이용하여 음성 신호만을 추출하여야 한다. 기존 연구에서는 음성의 위상 성분을 무시하고 크기 정보만을 이용하여 음원을 분리하였다. 본 연구에서는 크기 정보와 함께 위상 정보를 고려하여 음원 분리 및 방향 추정 알고리듬을 개발하여, 잡음과 반향 환경에 강인한 음성 인식기를 개발하고자 한다. 여러 개의 마이크를 장착한 스마트폰 및 지능로봇에서 제안 방법을 구현하여 실제 환경에서의 성능을 검증한다.

     

 

심음에 의한 심장질환 검출 (Cardiac disorder detection by heart sound signals) (2009-2010)

청진음 획득을 쉽게 하기 위하여 전자청진기에 블루투스 무선 인터페이스를 추가하였다. 무선 전자청진기는 원격진료서비스에 활용될 수 있으며, 의사가 환자에게 청진음을 들려줄 수 있는 장점이 있다. 심음신호로부터 심장질환을 검출하는 기술을 연구하였다. 심음신호는 주기신호로서 S1과 S2 두 개의 펄스로 구성되는데 심장질환이 있는 경우 이 두 펄스 이외에 심잡음 또는 클릭음이 존재하므로 이를 검출함으로써 질환 여부를 판정한다.

 

 

전산청각장면분석을 분석을 이용한 단일채널 음성분리 (Single channel speech separation using computational auditory scene analysis) (2007-2008)

인간의 칵테일 파티 효과를 용용한 전산청각장면분석(CASA) 기법을 응용하여 음성을 분리해내는 연구를 수행하였다. 분리된 음성신호는 음성인식의 입력으로 제공되어 잡음 환경에서도 강인한 음성인식 성능을 보여준다.

 

음성 레이블링 프로그램 개발 (Development of speech labeling program) (2006-2007)

음성학자들은 연구를 위하여 음성신호를 음소단위로 분할하여 기호를 붙이는 레이블링 작업이 필수적이다. 이를 돕기 위한 프로그램을 개발하는 것이 이 과제의 목표이다. 이 프로그램은 기존의 다른 프로그램에서의 불가능한 한글 입력과 불편한 사용자 인터페이스를 개선한 것으로서, 공개 프로그램으로 제공되고 있다.

 

HRI를 위한 감정인식 (Speech emotion recognition for human-robot interaction) (2005)

지농로봇과의 인간적인 인터페이스를 위하여 음성신호로부터 사람의 감정상태를 인지하는 연구이다. 감정인식은 앞으로 지능로봇이 활성화되면서 관심을 받게된 연구 분야이다.

 

한국어 음성인식 플랫폼 개발 (Development of Korean Speech Recognition Platform) (2004-2005)

고립단어인식에서부터 30,000단어급의 연속음성인식까지 가능한 한국어 음성인식 엔진을 개발하였다. 개발된 음성인식 엔진 (ECHOS)은 현재 SITEC에서 배포되고 있다.