“못 알아들어 속터지는 AI 스피커 이제 끝”

“못 알아들어 속터지는 AI 스피커 이제 끝”

유용하 기자
유용하 기자
입력 2021-02-15 15:07
업데이트 2021-02-15 15:07
  • 글씨 크기 조절
  • 프린트
  • 공유하기
  • 댓글
    14

카이스트 이건재 교수팀, 사람 귀 흉내낸 고감도 음성인식센서 개발

못 알아들어 속 터지는 인공지능 스피커, 이제는 없다
못 알아들어 속 터지는 인공지능 스피커, 이제는 없다
국내 연구진이 음성인식 고감도 인공지능 기반 기술을 개발했다.

언스플래쉬 개발
최근 인공지능(AI) 스피커를 사용하는 사람들이 많아지고 있다. 음성인식 수준이 높아졌다고는 하지만 여전히 제대로 알아듣지 못하고 엉뚱한 답변을 내놓거나 다른 명령을 수행하는 경우가 있다. 여전히 ‘못 알아들어’ 속터지는 경우가 잦다. 이에 국내 연구진이 사람의 귀를 흉내내 초고감도 인공지능 기반 음성센서를 개발해 주목받고 있다.

카이스트 신소재공학과 연구팀은 음성 주파수 영역에서 센서의 막이 큰 진폭으로 진동하는 공진현상을 활용해 전기신호가 만들어지는 공진형 유연 압전 음성센서를 개발해 정확도가 높은 초고감도 인공지능 기반 화자 식별 및 음성 보안기술을 구현했다고 15일 밝혔다. 또 스마트폰과 인공지능 스피커에 탑재해 제품화하는데도 성공했다. 이번 연구결과는 기초과학 및 공학분야 국제학술지 ‘사이언스 어드밴시스’ 12일자에 실렸다.

인간이 먼 거리의 소리를 인식하는 방법은 달팽이관에 있는 사다리꼴 막이 가청주파수 대역에서 공진현상을 발생시켜 소리를 증폭시킨다. 연구팀은 사람의 귀를 흉내내기 위해 얇은 유연 압전막을 사용해 여러 공진 채널을 구현해 소리를 초고감도로 식별할 수 있는 공진형 음성 센서를 만들었다.
스마트폰 및 인공지능 스피커에 탑재된 유연 압전 음성 센서
스마트폰 및 인공지능 스피커에 탑재된 유연 압전 음성 센서 카이스트 제공
유연 압전 음성센서는 신호 대 잡음비(SNR)가 우수해 음성인식 기능이 뛰어나고 다수의 채널을 이용해 적은 데이터양으로도 화자 식별 정확도를 높일 뿐만 아니라 원거리에서 스마트 기기들을 정확하게 제어할 수 있다. 연구팀이 개발한 음성센서를 같은 조건에서 기존 기술과 비교한 결과 음성인식 오류율을 60~95%까지 줄이는 것으로 확인됐다.

이건재 신소재공학과 교수는 “이번에 개발된 기술은 높은 민감도를 갖고 있으며 크기를 획기적으로 줄였기 때문에 미래 인공지능기술을 작동시키는데 핵심 센서로 적용할 수 있다”라며 “현재 대량생산 공정이 완성 단계에 있기 때문에 곧 상용화될 수 있을 것”이라고 말했다.

유용하 기자 edmondy@seoul.co.kr

많이 본 뉴스
‘민생회복지원금 25만원’ 당신의 생각은?
더불어민주당은 22대 국회에서 전 국민에게 1인당 25만원의 지역화폐를 지급해 내수 경기를 끌어올리는 ‘민생회복지원금법’을 발의하겠다고 밝혔습니다. 민주당은 빠른 경기 부양을 위해 특별법에 구체적 지원 방법을 담아 지원금을 즉각 집행하겠다는 입장입니다. 반면 국민의힘과 정부는 행정부의 예산편성권을 침해하는 ‘위헌’이라고 맞서는 상황입니다. 또 지원금이 물가 상승과 재정 적자를 심화시킬 수 있다고 우려합니다. 지원금 지급에 대한 당신의 생각은?
찬성
반대
모르겠다
광고삭제
위로