Skip to main content

Conteúdo prejudicial

A aba Conteúdo prejudicial permite habilitar um filtro que detecta e bloqueia respostas do agente contendo conteúdo nocivo.

Habilitar filtro de conteúdo prejudicial

Ative o toggle Habilitar filtro de conteúdo prejudicial para que o agente bloqueie ou modere respostas com discurso de ódio, insultos, violência ou conduta imprópria.

Ao habilitar, as configurações de nível por categoria ficam disponíveis.

Níveis de moderação por categoria

Configure a sensibilidade do filtro individualmente para cada categoria:

CategoriaO que detecta
Discurso de ódioLinguagem que ataca grupos com base em características como raça, religião ou gênero
InsultosXingamentos e linguagem degradante direcionada a pessoas
Conteúdo sexualConteúdo explícito ou sugestivo de natureza sexual
ViolênciaDescrições ou incentivo a atos violentos
Conduta imprópriaComportamentos inadequados que não se enquadram nas categorias acima

Para cada categoria, selecione o nível de moderação:

NívelComportamento
NenhumSem filtragem — o conteúdo não é verificado
BaixoBloqueia apenas conteúdo explicitamente prejudicial
MédioBloqueia conteúdo moderadamente prejudicial
AltoBloqueia qualquer indício de conteúdo prejudicial (mais restritivo)