본문 바로가기

탐구일기/경제신문스크랩

"장애인도 원하는 콘텐츠 즐기게…AI기술로 눈과 귀 열어요" - 매일경제 (2021.04.21)

728x90

"장애인도 원하는 콘텐츠 즐기게…AI기술로 눈과 귀 열어요"

음성-자막-수어 자동으로 변환
방통위·과기정통부, 기술 시연
2023년까지 프로그램에 적용 목표

"장애인도 원하는 콘텐츠 즐기게…AI기술로 눈과 귀 열어요"


한상혁 방통위원장이 20일 장애인의 날을 맞아 여의도 이룸센터에서 열린 `자막·수어방송 자동변환 기술 시연회`에서 인공지능을 활용한 변환 기술을 체험해보고 있다. [사진제공 = 방통위]

 

"시청각 장애인이 원하는 프로그램을 시청할 수 있도록 음성을 자동으로 자막으로 바꿔주고, 자막을 수어나 아바타 수어(아바타가 수화통역사 역할을 하는 것)로 바꿔드려요."

장애인들이 다양한 콘텐츠를 즐길 수 있도록 정부가 관련연구와 기술 지원을 강화한다. 인공지능(AI) 기술을 접목해 훨씬 빠르고 간편하게 전환되고, 다양한 미디어 콘텐츠까지 확대될 것으로 기대된다. 화면속 음향을 동적 효과로 제공하고 감정 표현까지 생생히 느낄 수 있는 상황해설 서비스도 개발한다.

 

방송통신위원회와 과학기술정보통신부는 20일 제41회 장애인의 날을 맞아 여의도 이룸센터에서 'AI기술을 활용한 자막·수어방송 자동변환 기술' 시연회를 열었다. 그동안 두 부처가 장애인 인권개선과 미디어 접근성 강화를 위해 협업해온 분야다. 한상혁 방송통신위원장은 과기정통부, 장애인단체(농아인협회, 시각장애인협회), 관련 연구기관 관계자들과 함께 한국정보통신기술협회(TTA)가 개발한 '음성-자막 자동변환 기술'과 한국전자통신연구원(ETRI)이 개발한 '장애인방송 시청 지원 감성표현 서비스' 기술을 체험했다.

음성-자막 자동변환 기술은 AI의 음성인식 기술을 활용해 스마트폰이나 태블릿PC 같은 모바일기기 음성을 자막으로 자동 변환해 화면에 표시해 주는 것으로, 청각장애인이나 귀가 어두운 고령층이 인터넷 동영상을 감상할 때 자막을 지원하는 기술이다. 장애인방송 시청 지원 감성표현 서비스는 청각장애인에게 시·공간 제약 없이 음성·자막을 아바타 수어로 변환하여 제공하는 기술과 다양한 감정을 음성으로 변환하여 시각장애인에게 제공할 수 있는 화면해설방송기술로 구성돼 있다.

방통위와 과기정통부는 오는 2023년까지 음성-자막-수어 자동변환 시스템을 개발하고, 이를 연계해 감성표현이 가능한 아바타 수어를 방송에 활용하는 것을 목표로 세웠다. 한 위원장은 "비대면 사회의 일상화로 미디어 서비스 이용이 급증한 만큼 미디어 소외계층의 요구를 반영한 기술개발로 미디어 격차 없는 따뜻한 디지털 포용 사회로 나아가도록 노력하겠다"고 밝혔다.

 

 

📊 기사 내용의 객관적 수치

  • 없음

 

 

🔎 추가 조사 내용

1. AI기술을 활용한 자막·수어방송 자동변환 기술

 

출처: 연합뉴스

 

1) 음성-자막 변환기술

- AI의 음성인식 기술을 활용해 모바일 기기의 음성을 자막으로 자동 변환해 화면에 표시해 주는 것

- 청각 장애인이 인터넷 동영상을 감상할 때 자막을 지원

- 방통위와 과기정통부는 2019년부터 음성-자막-수어 자동변환 시스템을 개발 중으로, 감성표현이 가능한 아바타 수어 서비스의 방송 활용을 목표로 함

 

출처: 연합뉴스

 

2) 장애인방송 시청지원 감성표현 서비스

- 시·청각 장애인의 미디어 접근권 향상을 위해 개발 중인 기술

- 청각장애인에게 시·공간의 제약 없이 음성·자막을 아바타 수어로 변환해 제공하는 '아바타 수어' 기술

- 다양한 감정을 음성으로 변환해 시각장애인에게 제공할 수 있는 '감성 표현 화면해설 방송' 기술

- 특히 '아바타 수어'는 미디어 플랫폼뿐만 아니라 코로나19 확산에 따른 사회적 거리 두기 방역 지침 안내, 병원 등 키오스크 출입 안내 등에서 활용이 기대됨

- 개발을 맡은 안충현 ETRI 책임은 "긴급한 상황에서 수어 통역사가 항상 대기하기 어려운 상황에서 하나의 대안이 되지 않을까 생각한다"고 말함

 

2. 디지털 콘텐츠 소외계층

1) 장애인 디지털 미디어 콘텐츠 소외

- 시각장애인들이 뉴미디어 콘텐츠를 통해 접할 수 있는 정보의 양은 비장애인들과 얼마나 다를까. 방송사들이 제작하는 대표적인 디지털 콘텐츠의 음성해설 여부를 살펴봤더니, 보이지 않은 장벽은 상당히 높았음

  • 지난 14일 고체비누를 소개한 JTBC <헤이뉴스>의 콘텐츠는 음성해설을 전혀 지원하지 않았음. 지난 12일부터 18일까지 <헤이뉴스>에 올라온 카드뉴스와 영상 콘텐츠 32개 가운데 절반가량은 음성 해설을 찾기 어려움
  • 방송사 가운데 가장 먼저 디지털 콘텐츠 서비스를 선보인 <스브스뉴스>는 모든 자막에 음성을 덧입힘  
  • 하현종 SBS디지털뉴스랩 크리에이티브부문 대표는 “스브스뉴스도 처음부터 '말자막'이나 배리어프리(Barrier-Free)를 적용한 것은 아니었지만, 장애인 이용자들과 단체들의 의견을 귀담아 듣고 점차 개선을 해왔다”면서 “자막을 읽는 데 차이가 있다는 걸 알고 있지만, 장애인들이 큰 틀에서 내용을 이해하실 수 있도록 내레이션 전체에 ‘말자막’을 달고 있다”고 설명함   

- 하나의 이미지에 많은 정보가 담긴 인포그래픽도 정보 접근성이 떨어짐. 시각장애인들이 주로 이용하는 ‘보이스오버‘ 기능을 이용해 코로나19 관련 인포그래픽을 읽어본 결과, 비장애인이 얻을 수 있는 정보와 비교해 제공받는 내용이 상대적으로 적었음

  • <뉴스1>이 매일 오전 게재하는 ’코로나19 확진자 지역별 현황‘ 그래픽에는 전날대비 확진자 증가 추이 등이 담겨있지만, '보이스오버'로는 지역별 확진자만 확인할 수 있었음
  • 장애인복지법에는 국가와 지방자치단체, 방송사가 장애인 정보접근권을 보장해야 한다는 조항이 있지만, 장애인방송 편성실적을 보면 최소한의 기준을 넘기는 수준. 지상파와 종합편성채널은 화면해설방송 의무편성 비율이 10%인데, 2020년에 가장 실적이 좋았던 MBC충북의 편성비율은 18.49%

- 방송사들이 뉴스 제작 환경과 비용 등을 이유로 화면해설방송을 전폭적으로 확대하지 못하다 보니 뉴스를 통해 전달받는 정보에도 차이가 날 수밖에 없음

  • 예컨대 최근 국제뉴스로 많이 다뤄지는 미얀마 민주화 운동과 일본의 방사능 오염수 방류 관련 인터뷰를 시각장애인들은 통역 없이 미얀어와 일본어로 듣고 있는 상황  
  • 김희영씨는 “요즘은 뉴스뿐만 아니라 시사, 다큐멘터리도 국제적인 이슈를 많이 다루는데, 생소한 언어가 나오면 알아들을 수가 없다”며 “제작비 문제라고 하지만, 미리 자막 음성을 붙이는 게 왜 힘든 것인지 모르겠다”라고 함. 제도의 문제가 아니라 방송사와 제작진의 인권 감수성, 의지의  문제가 아니냐는 지적
  • 김예원 장애인권법센터 변호사는 “미국의 경우 콘텐츠 제공자가 모든 영상에 대해 미디어 접근성을 고려하지 않으면 송출조차 할 수 없는 연방 법률을 제정한 사례도 있다. 이는 단순한 미디어 접근성 문제 차원이 아니라 전 사회에 걸친 디지털 불평등에 대한 문제”라고 강조

 

 

<용어 정리>

* 배리어 프리(Barrier Free)

: 고령자나 장애인들도 살기 좋은 사회를 만들기 위해 물리적·제도적 장벽을 허물자는 운동

: 일본·스웨덴·미국 등 선진국을 중심으로 휠체어를 탄 고령자나 장애인들도 비장애인과 다름 없이 편하게 살 수 있게 하자는 뜻에서 주택이나 공공시설을 지을 때 문턱을 없애자는 운동을 전개하면서 세계 곳곳으로 확산됨

: 2000년 이후에는 건축이나 도로·공공시설 등과 같은 물리적 배리어 프리뿐 아니라 자격·시험 등을 제한하는 제도적 법률적 장벽을 비롯해 각종 차별과 편견, 나아가 장애인이나 노인에 대해 사회가 가지는 마음의 벽까지 허물자는 운동의 의미로 확대 사용

*보이스오버(Voice-over)

: 연기자나 해설자 등이 화면에 보이지 않는 상태에서 대사나 해설 등의 목소리가 들리는 것. VO라고 줄여 표시하기도 함

: 보이스오버는 일반적으로 다음과 같은 경우에 쓰임

[1] 다큐멘터리 진술자
[2] 픽션 영화에서 전지적 시점의 내레이터. 여기서 내레이터는 영화의 시간과 공간을 해설하며 다음 사건을 암시하고 설명
[3] 영화에 등장하는 최초 내레이터. 주관적인 진술을 하거나, 서사적 기능을 수행
[4] 스크린 안 등장인물의 생각을 엿듣는 것
[5] 한 등장인물의 목소리가 다른 등장인물의 상상 속에서 들리는 것. 예를 들어 편지를 읽을 때
[6] 건물이나 차 밖에서, 그 안에서 대화하는 인물의 목소리를 들려줄 때
[7] 한 인물의 이야기가 이전 장면에서 현재의 장면으로 오버랩될 때

: ‘외화면 목소리’(off-screen voice)라는 용어는 보이스오버와 다름. 외화면 목소리의 경우 화자는 실제로 화면상의 신(scene)에 인접한 공간에서 현재 말하고 있는 상태이며 카메라가 이동하면 화자가 프레임에 포착될 수 있다는 인상을 줌

 

 

2) 고령층 디지털 접근에 어려움 

 

코로나19 발생 1년이 지나면서 고령층 등 사회적 취약계층을 중심으로 한 디지털 격차가 심화되고 있다는 조사 결과가 나왔다. / 출처: 뉴스1

 

- 코로나19 발생 1년이 지난 현재 디지털 전환이 가속화되면서 고령층·저소득층 등 사회적 취약계층을 중심으로 디지털 격차가 심화되고 있음
- 경기연구원이 실시한 설문조사 결과 경기도민 절반은 디지털 전환이 편리하고 효율적이지만 정보격차와 취약계층의 디지털 접근성 문제 등으로 디지털화에 대해 부정적이라고 응답함

  • 지난 2월17~18일 도민 1000명을 대상으로 실시한 디지털 소외에 대한 설문조사 결과 응답자 대부분은 온라인 쇼핑, 동영상 서비스, 인터넷 뱅킹 등 온라인 서비스 활용 능력이 우수한 편(89.5%)이지만 60대 이상은 상대적으로 낮은 수준(69.0%)을 보임
  • 전체 응답자의 71.2%가 온라인 서비스 이용 시 특별한 어려움이 없지만 60대 이상은 절반(50.0%)이 어려움을 느끼는 상황인 것으로 조사됨
  • 편의점과 프랜차이즈 점포에 설치된 무인 단말기(키오스크) 사용이 능숙하지 못한 비율은 전체적으로 11.5%에 불과하지만 60대 이상은 33.9%에 달해 차이가 컸다.

- 향후 무인점포가 늘어날 경우 가장 어려움을 느끼고 소외될 것으로 예상되는 그룹으로 고령층(60.9%)을 꼽음

 

3) 저소득층의 디지털 소외

- 온라인학습 인프라 환경 미흡에 따른 저소득층의 디지털 소외도 우려됨

- 온라인학습 시 스마트기기 보유 및 네트워크 환경 열악(38.9%), 자녀에 대한 온라인학습 지도 어려움(24.5%)이 문제라고 응답한 상황에서 향후 온라인학습이 확대될 때 가장 소외될 것으로 예상되는 그룹으로 저소득층 아동(49.0%)을 꼽음
- 스마트기기와 네트워크 환경을 갖추고 있지 못한 경우가 많고, 가정 내 혼자 생활하는 시간이 많아 어른의 학습지도가 어렵기 때문으로 예상됨
- 특히 ‘미래 디지털 소외계층이 될 것이 두렵다’는 응답자는 36.4%로, ‘현재 디지털 소외계층이라고 생각한다’(12.1%)의 3배 이상으로 나타나 누구나 디지털 소외계층이 될 수 있다는 우려 예방을 위한 정책지원이 필요함을 시사하고 있음

 

 

👀 적용할 점 

1. 장애인, 고령층, 저소득층 등 디지털 소외계층에게 필요한 사항은 다른데, 기업에서 그들을 위해 진행하는 업무가 있나요?

 

 

✍️ 요약 및 정리 

1. 장애인들이 다양한 콘텐츠를 즐길 수 있도록 정부가 관련연구와 기술 지원을 강화하고 있다. 

  • 인공지능(AI) 기술을 접목해 훨씬 빠르고 간편하게 전환되고, 다양한 미디어 콘텐츠까지 확대될 것으로 기대된다. 
  • 한국정보통신기술협회(TTA)가 개발한 '음성-자막 자동변환 기술'과 한국전자통신연구원(ETRI)이 개발한 '장애인방송 시청 지원 감성표현 서비스' 기술 등이 있다.
  • 한상혁 방통위원장은 "비대면 사회의 일상화로 미디어 서비스 이용이 급증한 만큼 미디어 소외계층의 요구를 반영한 기술개발로 미디어 격차 없는 따뜻한 디지털 포용 사회로 나아가도록 노력하겠다"고 밝혔다.

 

2. 디지털 소외계층이 느끼는 보이지 않은 장벽은 상당히 높다. 

  • 방송사들이 뉴스 제작 환경과 비용 등을 이유로 화면해설방송을 전폭적으로 확대하지 못하다 보니 뉴스를 통해 전달받는 정보에 차이가 난다. 
  • 코로나19 발생 1년이 지난 현재 디지털 전환이 가속화되면서 고령층·저소득층 등 사회적 취약계층을 중심으로 디지털 격차가 심화되고 있다.
  • 경기연구원이 실시한 설문조사에서 향후 무인점포가 늘어날 경우 가장 어려움을 느끼고 소외될 것으로 예상되는 그룹으로 고령층(60.9%)을 꼽았다. 
  • 온라인학습 인프라 환경 미흡에 따른 저소득층의 디지털 소외도 우려된다. 
  • 온라인학습 시 스마트기기 보유 및 네트워크 환경 열악(38.9%), 자녀에 대한 온라인학습 지도 어려움(24.5%)이 문제라고 응답한 상황에서 향후 온라인학습이 확대될 때 가장 소외될 것으로 예상되는 그룹으로 저소득층 아동(49.0%)을 꼽았다.

 

 

📍 참고자료

아바타가 감성표현에 수어까지…AI기술이 장애인 눈·귀 된다

넘치는 디지털 콘텐츠, 시각장애인에겐 높은 벽

[OTT온에어] '자막·수어방송' 본다…OTT 디지털 포용 '한발'

코로나19 발생 1년, 경기도민 디지털 격차 가속화

 

 

 

 

 

728x90
반응형