반응형
문. AI Speaker 작동 원리와 딥러닝 기반 지능형 언어 학습용 AI Speaker 제품 개발 방향(2022.10.)
답.
1. AI Speaker 작동 원리
<그림. AI Speaker 시스템 구조도>
구 분 | 설 명 |
개념 | - AI 스피커는 AI 스피커 부분과 AI 플랫폼으로 구성됨 - AI 스피커 부분은 사용자의 음성을 받아서 녹음하여 우측 AI 플랫폼으로 전달함 |
구성요소 | 1. STT(Speech to Text) - 받은 음성을 의미를 추론하여 사용자의 질문에 대한 응답을 의미 추론함 2. TTS(Text to Speech) - 대화 문장으로 변환하여 AI 스피커로 보내게됨 3. 대화엔진(Dialog Engine) - 딥러닝 기반(RNN, Recurrent Neural Network / CNN, Convolutional Neural Network)치계와 통계 기반으로 구성됨 |
2. AI Speaker 개발 현황
구 분 | 연도 | 용 도 |
알렉사 | 2014 | - 음악 감상, 생활정보 검색, 쇼핑, 홈기기 원격 제어, API 기술 무상 지원, 영어 학습 |
구글 홈 | 2016 | - 구글 어시스턴트, 검색 엔진 및 생활 정보, 음악 감상, 홈기기 원격 제어, 번역, 스마트폰, 자동차 등과 연동하여 작동 |
누구 | 2016 | - 셋톱박스 기반 스마트 홈 기능, 생활정보 검색, 금융, 연동된 각종기기 원격 제어, 실내 환경 데이터 화면 표시 |
기가지니 | 2017 | - IPTV 셋톱박스 기반 스마트 홈 기능, 음악 감상, 금융, 생활영어(파고다 학원용) |
3. 영어 학습용 AI Speaker 개발 방향
가. 영어 대화 학습용 AI Speaker 설계 방안
<그림. AI 챗봇 대화 진행 플로차트>
구 분 | 설 명 |
의도 파악 단계 |
- 사용자는 언어 학습자가 되는데, 그가 대화 문장으로 질문을 하면 챗봇은 이 대화 질문 내용의 의도를 파악함 - 이 모듈과 연계된 하위 정보처리 프로그램들이 동시 다발적으로 작동해서 대화 질문 의도 파악의 정확성을 높인다. |
자연어 처리 단계 | - 의도 파악 후 자연언어처리 기술의 지원을 받아 질문 의미를 자연어 처리하게 됨 - 인공지능 알고리즘과 연동하여 질문 의미를 파악(Intent)하고 적합한 응답을 다음 단계인 생성처리 단계로 넘김 |
생성처리 단계 |
- 질문에 맞는 응답이 응답 모듈의 하위정보처리 프로그램을 통해 자동으로 생성됨 - 자동 생성된 대화 응답에 대한 신뢰성 과정을 거친 후 챗봇으로 내보냄 |
나. RNN 기반 언어 대화학습용 AI Speaker 알고리즘 구현 방안
<그림. RNN과 LSTM 알고리즘 구조도>
구 분 | 설 명 |
개념 | - 가장 정교하게 개발된 언어 학습용 알고리즘으로는 자동생성 기반 알고리즘을 들 수 있음 - 이 알고리즘은 대화 응답을 대화엔진에서 자동적으로 생성해서 내보내느 방식임 |
특징 | - 미리 구축된 DB에서 응답을 추출하는 방식의 응답 추출 기반 알고리즘과 달리 대화 응답 정확성이 높음 |
1단계 (단어표현) |
- 알고리즘과 연동된 STT 기술을 사용하여 학습자가 질문한 일련의 언어 소리 흐름을 단어로 변환한 후 LSTM 계층을 거치게하여 각각의 단어군을 추출함 |
2단계 (문장 표현) |
- 1단계에서 올려 받은 단어들을 조합한 후, LSTM 계층을 거치게 하여 유의미한 문장을 엮어냄 - 이 문장은 Generative Process 자동처리과정을 거쳐 응닫ㅂ문을 생성하여 위 단계로 올려보냄 |
3단계 (문서 표현) |
- 2단계에서 올려 받은 문장의 의미를 추출하여 소프트맥스(Softmax) 신경망 체계를 거치게 하여 대화 문장으로 변환하여 학습자와 실제 대화가 가능하게 됨 |
다. 딥러닝 기반 지능형 언어대화 학습용 AI 스피커 제품 개발 방향
<그림. 인공지능기반 지능형 외국어 학습용 AI 스피커 보정 개발의 절차적 모형도>
구 분 | 설 명 |
언어교육 과정 수립 |
- 학습 대상 언어를 선정하여 학습하게 할 토픽, 단원 학습 구성, 대화 인접쌍 예시문, 학습 대상 언어기능 선정 등과 같은 기본 언어 자료를 개발함 - 개발된 데이터를 전처리 과정을 통해 형태소, 문법, 의미 등을 분석하고 태깅기법을 이용하여 데이터를 분류함 |
교수학습 설계 |
- 지능형 학습 시스템기반 설계, 학습자 오류 처치 방안, AI 스피커와 학습자 간의 상호작용, 교수자 및 학습자 전략 등을 고려해야됨 |
머신러닝 | - 딥러닝 기반 언어 학습용 알고리즘(RNN, CNN, LSTM 등) 처리과정을 거쳐 콘텐츠를 가공함 - 대화문 코퍼스를 알고리즘 내의 대화 생성 모듈 및 대화엔진과 연동시켜 쌍방형 언어 학습의 정확성을 높임 |
AI 스피커 시스템 보정 개발 | - 개발된 모든 자료들을 코드화된 콘텐츠로 변환시켜 이것을 기 개발된 범용 AI 스피커 기기에 탑재하여 딥러닝 기반 언어교육용 AI 스피커로 보정 개발함 |
도메인 | 인공지능 | 중요도 | 중 |
참고문헌 | 김인석, 컴퓨팅과 연합학습을 활용한 제조공정의 AI 데이터 분석 모델의 제안”, 주간기술동향, 2022.9.14, pp2-28. |
'정보통신 정보관리기술사 > 논문' 카테고리의 다른 글
문. 시맨틱 통신 연구 동향(2022.12.) (0) | 2023.01.08 |
---|---|
문. AI Bots를 위한 멀티에이전트 협업 기술 동향(2022.12.) (0) | 2023.01.06 |
문. 엣지 컴퓨팅과 연합학습을 활용한 제조공정의 AI 데이터 분석 모델의 제안 (0) | 2022.12.12 |
문. 공격 표면 관리 개념과 최소화 방안 동향 (0) | 2022.12.03 |
문. 인공지능 주요 동향 및 전망 (0) | 2022.12.01 |
문. 딥러닝 기반 행동 인식을 위한 비디오 처리기술 연구 동향(2022.11.) (1) | 2022.11.24 |
문. 경영학 연구 분야에서의 인공지능과 빅데이터 활용 동향(2022.11.) (2) | 2022.11.20 |
문. IIoT 회전기기 이상감지 AI 기술 동향 (0) | 2022.10.07 |