실시간 악성 댓글 필터링

Realtime Troll Filtering

실시간 악성 댓글 필터링

머신러닝 기법을 이용하여 Youtube Live의 스트리밍에서 실시간으로 유해/악성 댓글을 필터링합니다.

🤬

ANTI-TROLL Team

박규연	심재민	윤하은

Intro

스트리밍 방송에서 실시간으로 발생하는 댓글에 대해 혐오성 여부를 판단하고, 필터링함으로써 댓글 청정도 개선

Architecture

Data Processing

Environment

Docker
EC2

Process

유튜브 댓글 크롤링 라이브러리인 Pytchat을 사용하여 라이브 방송의 댓글을 수집하여 Kafka 클러스터로 메세지를 보냅니다.
메세지들은 해당 방송의 Topic에 적재됩니다.
Spark에서 Topic의 메세지들을 가져와 전처리를 진행합니다.
전처리가 진행된 텍스트를 FastAPI로 요청을 보내 추론 결과를 받아옵니다.

Models

Environment

Google Colab Pro+

Dataset

Experiments

	Accuracy	F1
KoBERT	0.621	0.649
SoongsilBERT	0.501	0.378
KoELECTRA	0.843	0.843

Run

Make Youtube Developer Account and prepare API Key.
Create the config.ini file as shown below.

  # config.ini
  [youtube]
  api_key = 'xxxxxxxxxxxxxxxxxxxxxxxxxx'

Execute with the following command (수정 중)

  $ make dependency
  $ make run

Demo

[Youtube] 실시간악성댓글필터링 데모영상

(학생설계형_팀형) Realtime-Troll-Filtering / ANTI-TROLL Team, 2023

Name		Name	Last commit message	Last commit date
Latest commit History 182 Commits
.github		.github
aws		aws
fast-api		fast-api
kafka-cluster		kafka-cluster
models		models
spark-cluster		spark-cluster
youtube-api		youtube-api
.gitignore		.gitignore
Makefile		Makefile
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Realtime Troll Filtering

실시간 악성 댓글 필터링

🤬

Intro

Architecture

Data Processing

Environment

Process

Models

Environment

Dataset

Experiments

Run

Demo

About

Releases

Packages

Contributors 3

Languages

noooey/realtime-troll-filtering

Folders and files

Latest commit

History

Repository files navigation

Realtime Troll Filtering

실시간 악성 댓글 필터링

🤬

Intro

Architecture

Data Processing

Environment

Process

Models

Environment

Dataset

Experiments

Run

Demo

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages