정보통신 정보관리기술사/논문

AI Speaker 작동 원리와 딥러닝 기반 지능형 언어 학습용 AI Speaker 제품 개발 방향

가카리 2022. 12. 19. 21:38
반응형

문. AI Speaker 작동 원리와 딥러닝 기반 지능형 언어 학습용 AI Speaker 제품 개발 방향(2022.10.)

답.

1. AI Speaker 작동 원리

 

<그림. AI Speaker 시스템 구조도>

구 분 설 명
개념 - AI 스피커는 AI 스피커 부분과 AI 플랫폼으로 구성됨
- AI 스피커 부분은 사용자의 음성을 받아서 녹음하여 우측 AI 플랫폼으로 전달함
구성요소 1. STT(Speech to Text)
- 받은 음성을 의미를 추론하여 사용자의 질문에 대한 응답을 의미 추론함
2. TTS(Text to Speech)
- 대화 문장으로 변환하여 AI 스피커로 보내게됨
3. 대화엔진(Dialog Engine)
- 딥러닝 기반(RNN, Recurrent Neural Network / CNN, Convolutional Neural Network)치계와 통계 기반으로 구성됨

 

2. AI Speaker 개발 현황

구 분 연도 용 도
알렉사 2014 - 음악 감상, 생활정보 검색, 쇼핑, 홈기기 원격 제어, API 기술 무상 지원, 영어 학습
구글 홈 2016 - 구글 어시스턴트, 검색 엔진 및 생활 정보, 음악 감상, 홈기기 원격 제어, 번역, 스마트폰, 자동차 등과 연동하여 작동
누구 2016 - 셋톱박스 기반 스마트 홈 기능, 생활정보 검색, 금융, 연동된 각종기기 원격 제어, 실내 환경 데이터 화면 표시
기가지니 2017 - IPTV 셋톱박스 기반 스마트 홈 기능, 음악 감상, 금융, 생활영어(파고다 학원용)

 

3. 영어 학습용 AI Speaker 개발 방향

가. 영어 대화 학습용 AI Speaker 설계 방안

<그림. AI 챗봇 대화 진행 플로차트>

구 분 설 명
의도 파악
단계
- 사용자는 언어 학습자가 되는데, 그가 대화 문장으로 질문을 하면 챗봇은 이 대화 질문 내용의 의도를 파악함
- 이 모듈과 연계된 하위 정보처리 프로그램들이 동시 다발적으로 작동해서 대화 질문 의도 파악의 정확성을 높인다.
자연어 처리 단계 - 의도 파악 후 자연언어처리 기술의 지원을 받아 질문 의미를 자연어 처리하게 됨
- 인공지능 알고리즘과 연동하여 질문 의미를 파악(Intent)하고 적합한 응답을 다음 단계인 생성처리 단계로 넘김
생성처
단계
- 질문에 맞는 응답이 응답 모듈의 하위정보처리 프로그램을 통해 자동으로 생성됨
- 자동 생성된 대화 응답에 대한 신뢰성 과정을 거친 후 챗봇으로 내보냄

 

나. RNN 기반 언어 대화학습용 AI Speaker 알고리즘 구현 방안

<그림. RNN과 LSTM 알고리즘 구조도>

구 분 설 명
개념 - 가장 정교하게 개발된 언어 학습용 알고리즘으로는 자동생성 기반 알고리즘을 들 수 있음
- 이 알고리즘은 대화 응답을 대화엔진에서 자동적으로 생성해서 내보내느 방식임
특징 - 미리 구축된 DB에서 응답을 추출하는 방식의 응답 추출 기반 알고리즘과 달리 대화 응답 정확성이 높음
1단계
(단어표현)
- 알고리즘과 연동된 STT 기술을 사용하여 학습자가 질문한 일련의 언어 소리 흐름을 단어로 변환한 후 LSTM 계층을 거치게하여 각각의 단어군을 추출함
2단계
(문장 표현)
- 1단계에서 올려 받은 단어들을 조합한 후, LSTM 계층을 거치게 하여 유의미한 문장을 엮어냄
- 이 문장은 Generative Process 자동처리과정을 거쳐 응닫ㅂ문을 생성하여 위 단계로 올려보냄
3단계
(문서 표현)
- 2단계에서 올려 받은 문장의 의미를 추출하여 소프트맥스(Softmax) 신경망 체계를 거치게 하여 대화 문장으로 변환하여 학습자와 실제 대화가 가능하게 됨

 

다. 딥러닝 기반 지능형 언어대화 학습용 AI 스피커 제품 개발 방향

 

<그림. 인공지능기반 지능형 외국어 학습용 AI 스피커 보정 개발의 절차적 모형도>

구 분 설 명
언어교육 과정
수립
- 학습 대상 언어를 선정하여 학습하게 할 토픽, 단원 학습 구성, 대화 인접쌍 예시문, 학습 대상 언어기능 선정 등과 같은 기본 언어 자료를 개발함
- 개발된 데이터를 전처리 과정을 통해 형태소, 문법, 의미 등을 분석하고 태깅기법을 이용하여 데이터를 분류함
교수학습
설계
- 지능형 학습 시스템기반 설계, 학습자 오류 처치 방안, AI 스피커와 학습자 간의 상호작용, 교수자 및 학습자 전략 등을 고려해야됨
머신러닝 - 딥러닝 기반 언어 학습용 알고리즘(RNN, CNN, LSTM 등) 처리과정을 거쳐 콘텐츠를 가공함
- 대화문 코퍼스를 알고리즘 내의 대화 생성 모듈 및 대화엔진과 연동시켜 쌍방형 언어 학습의 정확성을 높임
AI 스피커 시스템 보정 개발 - 개발된 모든 자료들을 코드화된 콘텐츠로 변환시켜 이것을 기 개발된 범용 AI 스피커 기기에 탑재하여 딥러닝 기반 언어교육용 AI 스피커로 보정 개발함

 

도메인 인공지능 중요도
참고문헌 김인석, 컴퓨팅과 연합학습을 활용한 제조공정의 AI 데이터 분석 모델의 제안”, 주간기술동향, 2022.9.14, pp2-28.