Group Project - Team RTA(너구리)
Name | Student ID | Part | |
---|---|---|---|
Taegyu Im | 20185999 | [email protected] | Backend |
Hayun Lee | 20193418 | [email protected] | AI |
Minki Kang | 20201980 | [email protected] | Frontend |
Pronunciation correction learning application for children aged 5 to 7
- McGurk effect, the interaction between visual and auditory information
- The importance of speech therapists’ use of visual materials
- Problem with lack of visual(mouth) information due to COVID-19
- The importance of repetitive learning and interest elements in pronunciation training
- World Health Organization (WHO) announces ‘Disease X’
- Artificial intelligence technology creates audio-visual materials appropriate for learning and helps children who have difficulty with correct pronunciation to repeatedly practice pronunciation.
- To ensure children's continuous learning, we apply elements that can stimulate interest, such as setting rewards and giving stars based on scores, to help children ultimately complete training.
- Creation of a lip sync model specialized for Korean based on the lip sync model (Wav2Lip) implemented for existing foreign languages.
- Lip-Sync: Wav2Lip
- TTS & STT: Google API
- OCR & ETRI(Electronics and Telecommunications Research Institute) Pronunciation Evaluation API
- Node.js & Flask Server
- MongoDB
- Flutter
5~7세 어린이 대상 발음 교정 학습 어플리케이션
- 시각 정보와 청각 정보의 상호작용인 맥거크 효과
- 언어치료사의 시각자료 활용 중요성
- 코로나19로 인한 시각 정보 부족 문제
- 발음 훈련의 반복학습과 흥미 요소 중요성
- 세계 보건 기구(WHO)의 '질병 X' 발표
주요 기능
- 문장 발음 학습 및 입모양 제시
- 카테고리별 회화 위주 문장 제공
- 학습자료의 입모양과 실제 입모양 비교 확인
- 학습자 커스텀을 위한 OCR과 TTS 활용
- 입모양 아바타 선택
- Wav2Lip를 활용한 입모양 아바타 생성
- 학습자 발음 분석 및 레벨 설정
- 보상 시스템을 통한 흥미 유발
- 전래동화 들려주기와 입모양 제시
- 인공지능을 활용한 학습에 적합한 시청각 자료 생성
- 발음 교정이 필요한 어린이들의 발음 훈련 보조
- 흥미 유발을 통한 꾸준한 학습 도모
- 다양한 학습 자료 제공 및 입모양 제시
- 유사 서비스와의 비교를 통한 차별화
주요 기술
- Lip-Sync: Wav2Lip
- TTS & STT: Google API 활용 예정
- OCR 및 발음 분석 기술 활용
- Node.js 및 Flask 서버로 클라이언트와 연결
- MongoDB 데이터베이스 활용