OpenAI는 정책 기반 분류를 지원하는 오픈 소스 보안 추론 모델 gpt-oss-safeguard를 출시했습니다.
이 모델은 오픈웨이트 gpt-oss를 기반으로 미세 조정되었으며 Apache 2.0 라이선스에 따라 라이선스가 부여되었으며, Hugging Face에서 다운로드할 수 있습니다. 내부 평가 결과, 다중 정책 정확도 측면에서 gpt-5-thinking과 gpt-oss보다 우수한 성능을 보였으며, 외부 데이터셋에 대한 성능은 Safety Reasoner와 유사한 수준입니다.
2025-10-29


