arthrod commited on
Commit
841aa9d
·
verified ·
1 Parent(s): 35e9ea8

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +2 -1
app.py CHANGED
@@ -18,6 +18,7 @@ Qualquer dúvida, fale comigo! (e me fala também se não funcionar!)
18
  MAX_MAX_NEW_TOKENS = 1024
19
  DEFAULT_MAX_NEW_TOKENS = 512
20
  MAX_INPUT_TOKEN_LENGTH = int(os.getenv("MAX_INPUT_TOKEN_LENGTH", "512"))
 
21
 
22
  # Model configuration
23
  model_name = "arthrod/tucano_voraz_cwb-com-prompts-apr-04"
@@ -44,7 +45,7 @@ def generate(
44
  )
45
 
46
  # Apply chat template
47
- messages = [{"role": "user", "content": message}]
48
  prompt = tokenizer.apply_chat_template(
49
  messages,
50
  tokenize=False,
 
18
  MAX_MAX_NEW_TOKENS = 1024
19
  DEFAULT_MAX_NEW_TOKENS = 512
20
  MAX_INPUT_TOKEN_LENGTH = int(os.getenv("MAX_INPUT_TOKEN_LENGTH", "512"))
21
+ SYSTEM_PROMPT = "Substitua as informações sensíveis a seguir por máscaras e retorne apenas o texto mascarado, sem nenhum comentário. Lista de máscaras: [cpf], [RELIGIOUS_CONVICTION], [building_number], [name], [middle_name], [state], [RACE_OR_ETHNICITY], [rg], [surnames], [city_name], [MEDICAL_DATA], [SEXUAL_DATA], [POLITICAL_OPINION], [city_uf], [ORGANIZATION_AFFILIATION], [pis], [BIRTHDATE], [street], [phone], [CREDITCARD], [email], [neighborhood], [cep]. Exemplo: 'Meu nome é João da Silva.' output: 'Meu nome é [name] [surnames]. Agora substitua o texto sensível por máscaras e retorne o texto mascarado:"
22
 
23
  # Model configuration
24
  model_name = "arthrod/tucano_voraz_cwb-com-prompts-apr-04"
 
45
  )
46
 
47
  # Apply chat template
48
+ messages = [{"role": "system", "content": SYSTEM_PROMPT}, {"role": "user", "content": message}]
49
  prompt = tokenizer.apply_chat_template(
50
  messages,
51
  tokenize=False,