Conteúdo prejudicial

A aba Conteúdo prejudicial permite habilitar um filtro que detecta e bloqueia respostas do agente contendo conteúdo nocivo.

Habilitar filtro de conteúdo prejudicial

Ative o toggle Habilitar filtro de conteúdo prejudicial para que o agente bloqueie ou modere respostas com discurso de ódio, insultos, violência ou conduta imprópria.

Ao habilitar, as configurações de nível por categoria ficam disponíveis.

Níveis de moderação por categoria

Configure a sensibilidade do filtro individualmente para cada categoria:

Categoria	O que detecta
Discurso de ódio	Linguagem que ataca grupos com base em características como raça, religião ou gênero
Insultos	Xingamentos e linguagem degradante direcionada a pessoas
Conteúdo sexual	Conteúdo explícito ou sugestivo de natureza sexual
Violência	Descrições ou incentivo a atos violentos
Conduta imprópria	Comportamentos inadequados que não se enquadram nas categorias acima

Para cada categoria, selecione o nível de moderação:

Nível	Comportamento
Nenhum	Sem filtragem — o conteúdo não é verificado
Baixo	Bloqueia apenas conteúdo explicitamente prejudicial
Médio	Bloqueia conteúdo moderadamente prejudicial
Alto	Bloqueia qualquer indício de conteúdo prejudicial (mais restritivo)

Habilitar filtro de conteúdo prejudicial​

Níveis de moderação por categoria​

Habilitar filtro de conteúdo prejudicial

Níveis de moderação por categoria