고양국제고/더브레인

더브레인 1차 결과물 소개

카루-R 2022. 6. 1. 18:25
반응형

환영합니다, Rolling Ress의 카루입니다.

여러분들이 최종보고서를 쓰기 전에, 우리가 무엇을 만들었는지는 확실하게 아는 게 좋을 것 같아서요. 여기 있는 내용을 대략적으로 이해만 하시고 넘어가면 될 것 같습니다.

5/30 시간에 프로그램을 만들어서 여러분께 드렸죠. 너무나도.... 단순한 녀석입니다. 외형적인 모습은 여러분들도 아마 지겹도록 보았을테니 생략하도록 하고요,

내부적인 이야기를 좀 하겠습니다. 우선 얘는 하나의 프로그램이지만 실질적으로 세 가지의 인공지능 모델을 탑재하고 있습니다. 성차별, 편향, 혐오표현을 각각 구분해내는 모델입니다. 특히 성차별 분류 모델의 경우 "성차별 표현이다" / "성차별 표현이 아니다"의 두 가지로 분류하기 때문에, 이진 분류 모델을 사용합니다.

내부적으로는 로지스틱 회귀라는 알고리즘을 사용합니다. 지금 보이는 그래프는 시그모이드 함수인데, 정의역은 실수 전체, 치역은 (0, 1)입니다. 여기에 그냥 100을 곱해주면 확률(%)이 되기 때문에, 확률을 계산할 때 많이 사용합니다. 우리도 내부적으로는 시그모이드 함수를 이용해 확률 계산을 하고 있어요. 그런데 여러분에게는 확률을 사용할 필요가 없기 때문에 제가 해당 기능을 빼버린 겁니다. 사실 만들기 귀찮았...읍읍..

기능을 새로 추가했습니다. 99.97%의 확률로 성차별 표현이라고 인식했죠. 이거 나중에 잘하면 일정 % 이상의 경우에만 차별 표현으로 인식시킬 수도 있습니다. 그러면 혐오표현을 걸러내는 능력은 좀 떨어지더라도, 실수는 줄일 수 있겠죠.


1차 보고서 제출 기한은 6월 3일 5교시까지입니다. 6교시에는 2차 결과물을 만들어볼 거예요. 저는 이번에 좀 회귀분석을 이용한 추론 모델을 만들어보고 싶은데, 여러분들의 의견이 필요합니다.

반응형