Spaces:

arthrod
/

tucano-voraz-old

Sleeping

arthrod commited on Apr 9

Commit

841aa9d

verified ·

1 Parent(s): 35e9ea8

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -18,6 +18,7 @@ Qualquer dúvida, fale comigo! (e me fala também se não funcionar!)
 MAX_MAX_NEW_TOKENS = 1024
 DEFAULT_MAX_NEW_TOKENS = 512
 MAX_INPUT_TOKEN_LENGTH = int(os.getenv("MAX_INPUT_TOKEN_LENGTH", "512"))
 # Model configuration
 model_name = "arthrod/tucano_voraz_cwb-com-prompts-apr-04"
@@ -44,7 +45,7 @@ def generate(
         )
     # Apply chat template
-    messages = [{"role": "user", "content": message}]
     prompt = tokenizer.apply_chat_template(
         messages,
         tokenize=False,

 MAX_MAX_NEW_TOKENS = 1024
 DEFAULT_MAX_NEW_TOKENS = 512
 MAX_INPUT_TOKEN_LENGTH = int(os.getenv("MAX_INPUT_TOKEN_LENGTH", "512"))
+SYSTEM_PROMPT = "Substitua as informações sensíveis a seguir por máscaras e retorne apenas o texto mascarado, sem nenhum comentário. Lista de máscaras: [cpf], [RELIGIOUS_CONVICTION], [building_number], [name], [middle_name], [state], [RACE_OR_ETHNICITY], [rg], [surnames], [city_name], [MEDICAL_DATA], [SEXUAL_DATA], [POLITICAL_OPINION], [city_uf], [ORGANIZATION_AFFILIATION], [pis], [BIRTHDATE], [street], [phone], [CREDITCARD], [email], [neighborhood], [cep]. Exemplo: 'Meu nome é João da Silva.' output: 'Meu nome é [name] [surnames]. Agora substitua o texto sensível por máscaras e retorne o texto mascarado:"
 # Model configuration
 model_name = "arthrod/tucano_voraz_cwb-com-prompts-apr-04"
         )
     # Apply chat template
+    messages = [{"role": "system", "content": SYSTEM_PROMPT}, {"role": "user", "content": message}]
     prompt = tokenizer.apply_chat_template(
         messages,
         tokenize=False,