kakaocorp/kanana-safeguard-8b · 이 모델은 범죄 관련 질문답 guardrail 용도 인가요?

Day1Kim

16 days ago

안녕하세요 모델 제공해주셔서 감사합니다.

kakaocorp/kanana-safeguard-8b 이 모델은 현재 s4 범죄 관련 질문답 가드레일 전용일까요?

sugar-free

Kakao Corp. org 16 days ago

@Day1Kim

안녕하세요. kanana safeguard 모델에 관심 가져주셔서 감사합니다.

모델카드에 포함된 작동 예시가 범죄(S4) 카테고리에 한정되어 있어 해당 리스크 전용 모델로 이해될 수 있으나 kakaocorp/kanana-safeguard-8b는 범죄 외에도 총 7가지 리스크 카테고리를 아우르는 다중 분류 기반 유해 콘텐츠 탐지 모델입니다. 본 모델이 탐지할 수 있는 리스크 카테고리는 증오(S1), 괴롭힘(S2), 성적 콘텐츠(S3), 범죄(S4), 아동 성착취(S5), 자살 및 자해(S6), 잘못된 정보(S7)로 구성되어 있습니다.

각 리스크 유형에 대한 자세한 설명은 모델카드 본문의 '리스크 분류 체계' 섹션 내 표 1을 참고 부탁드리며, 추가로 궁금하신 점 있으시면 언제든지 말씀 주세요.

Day1Kim

16 days ago

감사합니다. 모델 제작 또는 파인튜닝시 사용한 데이터는 오픈 데이터인가요?

sugar-free

Kakao Corp. org 15 days ago

@Day1Kim

본 모델은 정책에 부합하는 데이터셋을 학습하기 위해 전문 라벨러가 직접 생성하고 라벨링한 데이터 및 이를 기반으로 한 합성데이터로 학습하였습니다.