프로젝트기반 프론트엔드 (React,Vue) 웹&앱 SW개발자 양성과정
생성형 AI 시대! 기업에서 원하는 UI/UX 프론트엔드 실무개발자(디자인&퍼블리싱)
프레임워크 & AI 활용 자바 기반 풀스택 멀티플랫폼 웹서비스 개발과정
심화_클라우드 기반 MSA 적용 ERP 시스템 웹서비스 구현 프로젝트
C언어
파이썬(Python)) -응용SW 엔지니어링
자바(Java)
[UIUX] 풀스택(프론트&백앤드)을 위한 자바스크립트 (바닐라.JS/Javascript)
ChatGPT·Claude를 활용한 AI 웹 퍼블리싱 입문: HTML/CSS 실전 기초
ChatGPT를 활용한 콘텐츠 생성 플랫폼 개발: Spring Boot 실무 가이드
챗GPT-랭체인으로 AI 웹서비스 만들기
리액트(React)와 파이어베이스 (Firebase)로 시작하는 웹 개발 과정
Open API를 활용한 인터렉티브 웹 어플리케이션 개발 with Vanilla Javascript
[UIUX] 풀스택(프론트엔드&백엔드]리액트(React JS) 자바스크립트
생성형 AI 시대! 기업에서 원하는 UI/UX 프론트엔드 실무개발자(디자인&퍼블리싱)
[AI Worker] AI기반 디지털 광고영상 &숏폼 마케팅 프로젝트
[AI Worker] AI기반 멀티모달 출판편집디자인 콘텐츠 기획 및 인터랙티브 디지털 퍼블리싱
AI활용 트렌디한 공간마법사(건축설계&VR 실내인테리어디자인)블렌더활용
생성형 AI 시대! 기업에서 원하는 UI/UX 프론트엔드 실무개발자(디자인&퍼블리싱)
AI기반 실무형 3D 영상크리에이터 양성 (방송영상콘텐츠,모션그래픽,영상편집디자인)
[기업연계] AI활용 건축설계·BIM 모델링 프로젝트 실무
(디지털디자인) 생성형 AI 시대! 기업에서 원하는 UI/UX 프론트엔드 실무개발자(디자인&퍼블리싱)
AI+VR활용 건축설계&인테리어디자인(블렌더활용)
프레임워크 & AI 활용 자바 기반 풀스택 멀티플랫폼 웹서비스 개발과정
안녕하세요~ 그린컴입니다.
어제가 바로 중복이었는데 다들 맛있는 음식 든든하게 챙겨드셨나요?
점점 무르익어가는 더위 잘 이기시길 바라면서 오늘은 우리 실생활에서 쉽게 마주할 수 있는 기술 하나 소개해드리려고 합니다.
음성 합성 기술
다들 음성 합성 기술이라고 들어보셨나요?
음성 합성은 말 그대로 기계가 사람의 음성을 자동으로 분석, 합성하여 다시 말소리를 인위적으로 만들어내는 기술인데요. 지하철과 버스에서 들려오는 안내 목소리가 대표적인 음성 합성 시스템이라고 할 수 있습니다.
이 외에도 광고, 오디오북, 게임 등 다양한 분야에서 음성 합성이 많이 사용되고 있는데, 저 많은 내용을 성우가 과연 하나하나 녹음했을까 하는 생각도 들게 하는 만큼 요즘은 합성된 음성이 굉장히 부드럽고 자연스러워졌습니다.
예전의 음성 합성은 사전 녹음된 단어들을 쪼개고 조합해 음성을 만들어내는 단순 조합에 가까웠는데요. 현재는 빅데이터와 AI 기술이 접목되면서 기계가 사람의 목소리를 학습하고 톤, 어조까지 따라해내는 수준으로까지 발전하였습니다.
딥러닝을 기반으로 녹음된 발음을 학습하고 문장 부호, 문장 맥락까지 이해해 녹음되지 않은 음성까지 생성해낸다고 하니 얼마 있지 않아 합성된 음성과 실제 음성에 차이를 느끼지 못하는 수준까지 될 것 같네요.
다양한 활용
현재에는 단 몇분, 몇시간의 음성 샘플만 있으면 특정인의 목소리를 구현할 수 있는 음성 합성이 가능한데요. 그렇기 때문에 다양한 방면에서 이 기술이 활용, 개발되고 있습니다.
플리토에서는 유명 인사가 SNS에 글을 작성하면 그 당사자의 목소리로 게시글을 들을 수 있는 기술이 개발되고 있는데요. 재미는 물론이고, 본인이 작성한 언어가 아닌 외국어로 번역되어서도 구현이 가능하다고 하니 해외 유명 인사들과의 소통도 이제 어렵지 않을 것 같습니다.
KT에서는 동화 서비스인 \'내 목소리 동화\'를 최근 출시하였는데요. 이용자가 일정 문장을 녹음하면 기계가 음성 합성 기술을 통해 이용자의 목소리로 동화를 낭독해줍니다. 일하느라 아이와 보낼 시간이 부족해 소통 걱정이 많을 부모들의 짐을 조금 덜어줄 수 있을 것 같네요.
네이버는 지난 해 연예인의 합성된 음성을 AI스피커에 적용하기도 하였는데요. 예전부터 장난처럼 말해왔던 \'내가 좋아하는 연예인이 날씨를 알려줬으면 좋겠다\', \'AI스피커에서 연예인 목소리가 나왔으면 좋겠다\'와 같은 이야기가 이제는 허무맹랑하지 않게 되었습니다.

[이미지 : 플리토 사이트, KT 기가지니 사이트]
장애를 이기는 음성 합성
최근에는 뇌신경 손상으로 인해 말을 하지 못하는 사람들의 생각을 언어로 변환시키는 기술도 나왔다고 하는데요. 언어 관련 뇌파, 발성기관(턱, 입술, 혀 등)들의 움직임 분석 등을 통해 음성을 만들어낼 수 있다고 합니다.
쉬운 단어, 문장의 경우에는 69%의 정확성을 보인다고 하는데 이 정도면 멀지 않은 미래에 생각을 음성으로 완벽하게 구현할 수 있을 것 같네요.
악용의 위험
모든 기술의 발전에는 문제점이 따라오듯이, 특정인의 음성이 완벽하게 구현된다면 악용될 가능성이 높지 않을까 하는 걱정도 많이 있는데요. 보이스피싱에서부터 고위인사들의 음성 사칭 등 우리를 위협할 부분들이 쉽게 발생할 수 있습니다.
이에 대해서는 목소리의 주인공이 지정한 단말에서만 음성 사용 가능, 오디오 워터마크 새기기 등과 같은 해결법이 나오고 있다고 하는데요. 범죄와 관련될 수 있는 만큼 이 부분에 대해서는 계속 개발하고 철저하게 대처해야할 것 같습니다.
지금까지 음성 합성 기술에 대해서 이야기해보았는데요.
우리의 삶에 편리함을 줄 뿐만 아니라 장애가 있는 분들에게는 자신의 생각을 자유롭게 표현할 수 있는 방안을 만들어 주는 음성 합성 기술! 앞으로가 더욱 기대됩니다~