간편하게 보는 뉴스는 유니콘뉴스
미디어젠-ETRI, 구글 컨포머 보다 빠른 컨볼루션 신경망 아키텍쳐 개발

· 등록일 2023-12-26 09:00

· 업데이트일 2023-12-26 10:02:33

성남--(뉴스와이어)--코스닥 상장사 미디어젠(코스닥 279600, 대표 고훈)은 구글이 개발한 대표적인 E2E 음성인식 시스템인 ‘컨포머(Conformer)’를 벤치마킹해 기존 컨포머의 성능을 그대로 유지하면서도 처리 속도를 약 40% 가량 향상 시킬 수 있는 새로운 컨볼루션 네트워크 구조가 증강된 트랜스포머 기반의 음성인식 시스템을 개발했다고 26일 밝혔다.

신규 개발 ‘AIMZformer’의 음성인식 구조도 신규 개발 음성인식 컨벌루션 블록도 이번 기술 개발은 한국전자통신연구원(ETRI)의 연구인력 현장지원 프로그램을 통해 이뤄졌으며, ETRI의 이성주 책임 연구원과 미디어젠의 윤종성 AIMZ 연구소장 등 음성인식 전문 인력들이 참여했다.

LJSpeech 데이터셋을 이용한 음성인식 실험결과, 구글의 컨포머는 CER 4.8%, WER 19.6%의 성능을 보였고, 가칭 ‘AIMZformer’(미디어젠 음성인식 시스템)는 CER 4.8%, WER 19.2%의 성능을 각각 확인했다. 이를 바탕으로 구글 컨포머 수준의 음성인식 성능이 유지하는 것을 알 수 있으며, 처리 속도는 컨포머 서브샘플링 40ms 대비 80ms로 크게 향상됐음을 확인할 수 있다. 이로 인해 학습시간이 약 40% 가량 절약된다.

참고로 베이스라인이 되는 트랜스포머 기반의 음성인식 시스템은 CER 6.9%, WER 23.0%의 인식 성능을 나타내고 있는데, 본 실험에서는 순수한 신경망의 성능을 평가하기 위해 빔서치(beam search) 등의 백엔드 처리를 수행하지 않고, 아웃풋 노드의 범주형 교차 엔트로피만으로 학습 및 평가가 진행됐으며, 음성인식에 필요한 유닛으로는 알파벳 기반의 캐릭터(character)를 이용해 인식 난이도가 높다.

구글 컨포머가 엔코더 성능에 집중하는데 반해 이번에 개발된 미디어젠 AIMZ 연구소의 컨볼루션 구조는 범용성에 그 초점을 맞추고 있기 때문에 엔코더뿐만 아니라 디코더의 성능을 향상시켜주는 장점을 갖고 있다. 특히 미디어젠은 임베디드 솔루션 개발에도 경쟁력을 갖고 있으며, 향후 AI 로봇이나 소형 전자 기기 등 네트워크가 없는 전자기기에 탑재할 수 있는 빠른 속도의 엔진 공급을 추진 중이다.

미디어젠 AIMZ 연구소의 윤종성 소장은 “이번 신기술의 개발로 음성인식 성능을 유지하면서도 처리 속도를 크게 높인 자체 컨포머 기술을 확보함으로써 음성인식 반응 속도에 불만을 갖는 사용자들의 만족도를 크게 향상시킬 수 있게 됐다”면서 “향후 음성인식 기술이 활용되는 사업 전반에 속도 개선이 이뤄질 것”이라고 밝혔다.

한편 미디어젠 AIMZ 연구소에서는 음성인식 속도에 초점을 맞춘 다양한 기술 개발뿐만 아니라 하나의 음성인식 모델로 다국어 음성인식을 할 수 있는 기술을 이미 갖추고 있으며, 글로벌 플랫폼 기업들과 동등한 수준의 국제적 기술 경쟁력을 갖추기 위해 새로운 거대 모델(LLM) 개발도 병행 중에 있다.

미디어젠 소개

미디어젠은 음성 AI 기반 기술을 바탕으로 스마트카, 스마트 컨택센터, AI 에듀테크, AI 키오스크, 다국어 AI 통역 서비스 등 다양한 사업 분야에서 보다 더 앞선 신기술과 서비스를 제공하는 코스닥 상장 기업이다. 최근 초거대 AI를 위한 데이터 구축 및 생성형 AI 챗봇 기술 등 최신 알고리즘을 개발해 첨단 기술 사업화에 앞장서고 있다.

웹사이트: http://www.mediazen.co.kr/ 연락처 미디어젠
R&D 전략그룹
이현석 프로
02-6429-7100
이메일 보내기 
이 뉴스는 제공자가 작성해 발표한 보도자료입니다.
뉴스와이어는 제공기관의 투명성을 확인하고 뉴스 내용의 오류를 없애고자 노력하고 있습니다.
이 회사와 관심 분야의 보도자료를 메일과 RSS로 무료 구독할 수 있습니다. 구독하기> 뉴스 제공미디어젠 배포 분야 기술 인공지능 연구개발 인천 경기
배포 분야
인기 기사04.26 19시 기준
서울--(뉴스와이어)--비즈니스북스가 투자자도 고객도 없는 상황에서 투자받을 기회를 얻을 수 있는 방법을 담은 ‘결정적 기회를 만드는 힘’을 출간했다. 비즈니스북스 ‘결정적 기회를 만드는 힘’ 표지 ...
서울--(뉴스와이어)--현대오토에버가 사회취약계층의 이동 및 생활 편의 증진을 위한 ‘2024 배리어프리 앱 개발 콘테스트’(이하 콘테스트) 참가자를 모집한다고 15일 밝혔다. 이번 콘테스트는 현대오토에버와 서울사회복지공동모금회 지원, 사단법인 그린라이트 주관, 과학기술정보통신부와 교육부 국립특수교육원의 후원으로 개최된다. ...
화성--(뉴스와이어)--화성시문화재단(대표이사 김신아)이 2024년 ‘화성시 예술단’을 이끌어갈 신규 단원을 모집한다. ‘화성시 예술단’ 신규단원 모집 포스터 ‘화성시 예술단’은 지역 내 문화 균등...
대전--(뉴스와이어)--혁신적인 전장 유전체 인사이트를 제공하는 이노크라스가 암과 희귀 질환을 위한 전장 유전체 진단 솔루션, ‘캔서비전(CancerVision)’과 ‘레어비전(RareVision)’을 출시했다고 발표했다. 이노크라스의 솔루션은 의료진에게 잘 알려지지 않은 희귀 돌연변이와 복잡한 유전 변이도 탐지할 수 있는 새로운 유전자...
타이페이--(뉴스와이어)--글로벌 컴퓨팅 전문 기업 ASUS의 한국 지사인 에이수스 코리아(지사장 강인석, 이하 에이수스)는 견고한 디자인과 뛰어난 성능을 발휘하며, 향상된 쿨링 솔루션을 갖춘 TUF Gaming 지포스 RTX™ 4090 그래픽카드를 출시했다. ...
LONG BEACH, CALIF.--(Business Wire / Korea Newswire)--Laserfiche — the leading SaaS provider of intelligent content management and business process automation — is a Leader in the Nucleus Research Technology Value Matrix for Content Services...
API
fg
유니콘뉴스는 보도자료 배포 서비스입니다.
여기에 뉴스를 등록하면 언론이 보도하고 널리 배포됩니다.