Smilegate AI에서 공개하는 한국어 혐오표현 "
본 테이터셋에서의 혐오 표현은 “특정 사회적 (소수자) 집단에 대한 적대적 발언, 조롱, 희화화, 편견을 재생산하는 표현”으로 정의합니다.
- 혐오의 대상이 속한 집단을 명확히 지칭하는 비하·차별발언
- 대상에 대한 고정관념 (e.g. 동양인은 수학 잘하지 않아?, 역시 흑형이라 운동을 잘하네)
- 대상의 특성이나 성향을 특정한 통념에 고착시키는 발언 (e.g. 여자는 집에서 애나 봐야지!, 임신은 축복이지!, 게이는 잘생겨야지)
- 화자 스스로를 자조적으로 표현하는 경우는 혐오 발언이 아님 (e.g. 아 내가 급식충이다!)
단일 데이터는 [혐오표현, 악플/욕설, clean]으로 분류될 수 있으며, 혐오 표현은 다중 레이블(multi-label)로 전문가 집단을 통해 레이블링되었습니다.
항목 | 문장 수 |
---|---|
혐오표현 | 10,139 |
악플/욕설 | 3,929 |
Clean | 4,674 |
Total | 18,742 |
문장 | 여성/가족 | 남성 | 성소수자 | 인종/국적 | 연령 | 지역 | 종교 | 기타혐오 | 악플/욕설 | clean | 개인 지칭 |
---|---|---|---|---|---|---|---|---|---|---|---|
한남 답이 없노 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
옛말에 암탉이 울면 나라 망한다고 했다 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
꼭 키 작은 급식충이 이런 글 씀 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 |
뭐 어쩌라고 시발 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 |
혐오가 당연한 건 없습니다 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 |
- [여성/가족]
여성성 및 여성의 성역할에 대한 통념을 고착시키는 발언, 여성 차별을 희화화하는 발언, 페미니즘·여성가족부 전반에 대한 악플 등을 포함합니다.
간호사, 여경 등 여성을 중심으로 구성된 집단에 대한 조롱 역시 여성 혐오 표현으로 분류하였습니다.
비혼주의자, 미혼모, 동성 부부 등 전통적이지 않은 형식의 가족에 대한 혐오 발언 역시 본 카테고리에 포함됩니다. - [남성]
집단으로서의 남성 일반을 비하, 조롱, 희화화하는 발언들입니다. - [성소수자]
성소수자(레즈비언, 게이, 바이섹슈얼, 트랜스젠더 등)를 배척하는 발언입니다.
이성애 이외의 섹슈얼리티를 부정적으로 묘사하거나 성소수자를 희화화하는 표현들을 포함합니다. - [인종/국적]
특정 인종(흑인, 아시안 등)과 국적(일본인, 아프가니스탄인, 베트남인 등)에 대한 욕설, 고정관념, 조롱을 다룹니다.
종교·인종·국가에 대해 암묵적으로 함께 지칭하는 소재 (e.g. 무슬림, 난민)의 발언들 역시 본 카테고리에 포함됩니다. - [연령]
특정 세대나 연령을 비하하는 은어의 사용 및 혐오 표현을 분류하였습니다. - [지역]
특정 지역에 대한 은어 및 혐오 표현을 분류하였습니다. - [종교]
특정 종교에 대한 혐오 및 종교인 집단에 대한 비난을 분류하였습니다. - [기타혐오]
위에서 정의한 카테고리 이외의 집단을 대상으로 하는 혐오 표현을 분류하였습니다. (e.g. 장애인, 정부, 기자, 경찰, 차별금지법 반대 등) - [악플/욕설]
어떤 집단을 향한 혐오 표현인지 지칭할 수는 없지만, 타인 혹은 외모에 대한 비하/욕설이 포함되어 있거나, 불쾌감을 주거나, 악플과 음란성 문장을 분류하였습니다. - [Clean]
혐오표현, 욕설, 불쾌감, 음란성 내용을 포함하고 있지 않은 일반 문장을 분류하였습니다.
- 혐오 및 욕설의 대상이 특정 인물을 지칭하고, 그 대상을 대중들이 누구인지 눈치챌 수 있을 경우 '개인 지칭' 항목으로 추가 태깅하였습니다.
- 단일 댓글 문장에 대해 3명의 작업자가 혐오 카테고리 분류
- 5인의 혐오 표현 전문가가 최종 검수
- 혐오의 판단 기준은 사람마다 상이할 수 있으며, 태깅 결과는 100%의 정확도를 보장하지 않습니다. 태깅 오류를 발견하실 경우, issue에 남겨주세요!
본 데이터셋은 huggingface datasets hub를 통해 사용할 수 있습니다.
항목 | 여성/가족 | 남성 | 성소수자 | 인종/국적 | 연령 | 지역 | 종교 | 기타혐오 | 악플/욕설 | clean |
---|---|---|---|---|---|---|---|---|---|---|
Train | 1,599 | 1,347 | 1,138 | 1,728 | 603 | 1,052 | 1,181 | 569 | 3,146 | 3,739 |
Validation | 394 | 334 | 280 | 426 | 146 | 260 | 290 | 134 | 786 | 935 |
Total | 1,993 | 1,681 | 1,418 | 2,154 | 749 | 1,312 | 1,471 | 703 | 3,932 | 4,674 |
- Python
>>> from datasets import load_dataset
>>> datasets = load_dataset('smilegate-ai/kor_unsmile')
>>> print(datasets)
DatasetDict({
valid: Dataset({
features: ['문장', '여성/가족', '남성', '성소수자', '인종/국적', '연령', '지역', '종교', '기타 혐오', '악플/욕설', 'clean', '개인지칭', 'labels'],
num_rows: 3737
})
train: Dataset({
features: ['문장', '여성/가족', '남성', '성소수자', '인종/국적', '연령', '지역', '종교', '기타 혐오', '악플/욕설', 'clean', '개인지칭', 'labels'],
num_rows: 15005
})
})
Google colab을 통해 모델 학습과 테스트를 할 수 있는 tutorial 노트북을 공유합니다.
- Python
>>> from transformers import TextClassificationPipeline, BertForSequenceClassification, AutoTokenizer
>>> model_name = 'smilegate-ai/kor_unsmile'
>>> model = BertForSequenceClassification.from_pretrained(model_name)
>>> tokenizer = AutoTokenizer.from_pretrained(model_name)
>>> pipe = TextClassificationPipeline(
model = model,
tokenizer = tokenizer,
device = 0, # cpu: -1, gpu: gpu number
return_all_scores = True,
function_to_apply = 'sigmoid'
)
>>> for result in pipe("이래서 여자는 게임을 하면 안된다")[0]:
print(result)
{'label': '여성/가족', 'score': 0.8253053426742554}
{'label': '남성', 'score': 0.039725180715322495}
{'label': '성소수자', 'score': 0.012144332751631737}
{'label': '인종/국적', 'score': 0.023181889206171036}
{'label': '연령', 'score': 0.010315303690731525}
{'label': '지역', 'score': 0.018454890698194504}
{'label': '종교', 'score': 0.011270025745034218}
{'label': '기타 혐오', 'score': 0.0207340307533741}
{'label': '악플/욕설', 'score': 0.057331427931785583}
{'label': 'clean', 'score': 0.1401052623987198}
문장 | 여성/가족 | 남성 | 성소수자 | 인종/국적 | 연령 | 지역 | 종교 | 기타혐오 | 악플/욕설 | clean |
---|---|---|---|---|---|---|---|---|---|---|
이래서 여자는 게임을 하면 안된다 | 0.83 | 0.04 | 0.01 | 0.02 | 0.01 | 0.02 | 0.01 | 0.02 | 0.06 | 0.12 |
한남 재기해 | 0.04 | 0.90 | 0.01 | 0.03 | 0.02 | 0.02 | 0.02 | 0.01 | 0.08 | 0.05 |
젠신병자들 극혐 | 0.13 | 0.04 | 0.93 | 0.04 | 0.14 | 0.07 | 0.07 | 0.77 | 0.10 | 0.04 |
니네 나라로 좀 돌아가라 | 0.02 | 0.02 | 0.01 | 0.90 | 0.02 | 0.02 | 0.03 | 0.02 | 0.06 | 0.04 |
틀니 압수할게요 | 0.02 | 0.04 | 0.03 | 0.02 | 0.70 | 0.02 | 0.02 | 0.03 | 0.07 | 0.11 |
너도 설마 머구 출신? | 0.02 | 0.01 | 0.02 | 0.04 | 0.02 | 0.90 | 0.02 | 0.03 | 0.04 | 0.13 |
개독이나 이슬람이나 똑같지 않냐 | 0.03 | 0.02 | 0.03 | 0.08 | 0.02 | 0.03 | 0.95 | 0.04 | 0.03 | 0.04 |
지잡 나와서 고생한다 | 0.03 | 0.02 | 0.04 | 0.02 | 0.10 | 0.10 | 0.11 | 0.55 | 0.30 | 0.08 |
진짜 극혐이네요 | 0.01 | 0.01 | 0.01 | 0.01 | 0.01 | 0.02 | 0.02 | 0.02 | 0.88 | 0.08 |
남자 여자 모두 응원합니다 | 0.18 | 0.05 | 0.03 | 0.01 | 0.01 | 0.01 | 0.01 | 0.01 | 0.05 | 0.76 |
precision recall f1-score support
여성/가족 0.85 0.70 0.76 394
남성 0.87 0.83 0.85 334
성소수자 0.90 0.78 0.83 280
인종/국적 0.87 0.79 0.82 426
연령 0.92 0.75 0.83 146
지역 0.87 0.88 0.88 260
종교 0.87 0.86 0.87 290
기타혐오 0.92 0.18 0.30 134
악플/욕설 0.76 0.59 0.67 786
clean 0.74 0.79 0.77 935
micro avg 0.82 0.73 0.77 3985
macro avg 0.86 0.72 0.76 3985
weighted avg 0.82 0.73 0.77 3985
samples avg 0.76 0.74 0.75 3985
@misc{SmilegateAI2022KoreanUnSmileDataset,
title = {Korean UnSmile dataset: Human-annotated Multi-label Korean Hate Speech Dataset},
author = {Seonghyun Kim},
year = {2022},
howpublished = {\url{https://github.com/smilegate-ai/korean_unsmile_dataset}},
}
@misc{kang2022korean,
title={Korean Online Hate Speech Dataset for Multilabel Classification: How Can Social Science Aid Developing Better Hate Speech Dataset?},
author={TaeYoung Kang and Eunrang Kwon and Junbum Lee and Youngeun Nam and Junmo Song and JeongKyu Suh},
year={2022},
eprint={2204.03262},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
https://arxiv.org/pdf/2204.03262
기획 및 제작 (Smilegate AI)
데이터 태깅 및 검수 (언더스코어)
언더스코어는 데이터 기반 지식 컨텐츠 스타트업입니다.
전문지식을 소개하는 모션그래픽을 제작하고, 사회과학 분야에서 데이터 분석과 컨설팅 활동을 해오고 있습니다.
Smilegate AI UnSmile
의 소스코드 및 baseline 모델
은 Apache 2.0 라이선스 하에 공개되어 있습니다.
Smilegate AI UnSmile
의 데이터셋
은 CC-BY-NC-ND 4.0 라이선스 하에 공개되어 있습니다.
코드 및 모델, 데이터셋을 사용할 경우 라이선스 내용을 준수해 주십시오.
데이터셋의 상업적 사용의 경우, [email protected]
으로 문의 부탁드립니다.
본 데이터셋의 내용은 Smilegate AI의 의견과 무관합니다.