Skip to content

머신러닝 기법을 이용한 실시간 유해/악성 댓글 필터링

Notifications You must be signed in to change notification settings

noooey/realtime-troll-filtering

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Realtime Troll Filtering

실시간 악성 댓글 필터링

머신러닝 기법을 이용하여 Youtube Live의 스트리밍에서 실시간으로 유해/악성 댓글을 필터링합니다.

🤬

ANTI-TROLL Team
박규연 심재민 윤하은

 

Intro

스트리밍 방송에서 실시간으로 발생하는 댓글에 대해 혐오성 여부를 판단하고, 필터링함으로써 댓글 청정도 개선

Architecture

image

Data Processing

Environment

  • Docker
  • EC2

Process

  1. 유튜브 댓글 크롤링 라이브러리인 Pytchat을 사용하여 라이브 방송의 댓글을 수집하여 Kafka 클러스터로 메세지를 보냅니다.
  2. 메세지들은 해당 방송의 Topic에 적재됩니다.
  3. Spark에서 Topic의 메세지들을 가져와 전처리를 진행합니다.
  4. 전처리가 진행된 텍스트를 FastAPI로 요청을 보내 추론 결과를 받아옵니다.

Models

Environment

  • Google Colab Pro+

Dataset

Experiments

Accuracy F1
KoBERT 0.621 0.649
SoongsilBERT 0.501 0.378
KoELECTRA 0.843 0.843

Run

  1. Make Youtube Developer Account and prepare API Key.
  2. Create the config.ini file as shown below.
  # config.ini
  [youtube]
  api_key = 'xxxxxxxxxxxxxxxxxxxxxxxxxx'
  1. Execute with the following command (수정 중)
  $ make dependency
  $ make run

Demo

[Youtube] 실시간악성댓글필터링 데모영상


(학생설계형_팀형) Realtime-Troll-Filtering / ANTI-TROLL Team, 2023

About

머신러닝 기법을 이용한 실시간 유해/악성 댓글 필터링

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published