Conteúdo prejudicial
A aba Conteúdo prejudicial permite habilitar um filtro que detecta e bloqueia respostas do agente contendo conteúdo nocivo.
Habilitar filtro de conteúdo prejudicial
Ative o toggle Habilitar filtro de conteúdo prejudicial para que o agente bloqueie ou modere respostas com discurso de ódio, insultos, violência ou conduta imprópria.
Ao habilitar, as configurações de nível por categoria ficam disponíveis.
Níveis de moderação por categoria
Configure a sensibilidade do filtro individualmente para cada categoria:
| Categoria | O que detecta |
|---|---|
| Discurso de ódio | Linguagem que ataca grupos com base em características como raça, religião ou gênero |
| Insultos | Xingamentos e linguagem degradante direcionada a pessoas |
| Conteúdo sexual | Conteúdo explícito ou sugestivo de natureza sexual |
| Violência | Descrições ou incentivo a atos violentos |
| Conduta imprópria | Comportamentos inadequados que não se enquadram nas categorias acima |
Para cada categoria, selecione o nível de moderação:
| Nível | Comportamento |
|---|---|
| Nenhum | Sem filtragem — o conteúdo não é verificado |
| Baixo | Bloqueia apenas conteúdo explicitamente prejudicial |
| Médio | Bloqueia conteúdo moderadamente prejudicial |
| Alto | Bloqueia qualquer indício de conteúdo prejudicial (mais restritivo) |