Configurar Thresholds de Moderação

Ajuste a sensibilidade da moderação por categoria. Valores menores = mais sensível (detecta mais), valores maiores = menos sensível (detecta menos).

Como funciona: O threshold define a pontuação mínima (0.0 a 1.0) que a API precisa retornar para considerar uma categoria como detectada. Por exemplo, com threshold 0.3, qualquer pontuação ≥ 0.3 será considerada detectada.
Thresholds por Categoria
Carregando...

Carregando thresholds...

Dicas de Configuração
  • 0.0 - 0.3: Muito sensível - detecta quase tudo (pode gerar falsos positivos)
  • 0.3 - 0.5: Sensível - detecta conteúdo claramente problemático
  • 0.5 - 0.7: Moderado - apenas conteúdo claramente problemático (padrão OpenAI)
  • 0.7 - 1.0: Menos sensível - apenas conteúdo extremamente problemático

Recomendação: Comece com 0.5 (padrão) e ajuste baseado no feedback do sistema de treinamento.