Spaces:
Sleeping
Sleeping
Update app.py
Browse files
app.py
CHANGED
@@ -18,6 +18,7 @@ Qualquer dúvida, fale comigo! (e me fala também se não funcionar!)
|
|
18 |
MAX_MAX_NEW_TOKENS = 1024
|
19 |
DEFAULT_MAX_NEW_TOKENS = 512
|
20 |
MAX_INPUT_TOKEN_LENGTH = int(os.getenv("MAX_INPUT_TOKEN_LENGTH", "512"))
|
|
|
21 |
|
22 |
# Model configuration
|
23 |
model_name = "arthrod/tucano_voraz_cwb-com-prompts-apr-04"
|
@@ -44,7 +45,7 @@ def generate(
|
|
44 |
)
|
45 |
|
46 |
# Apply chat template
|
47 |
-
messages = [{"role": "user", "content": message}]
|
48 |
prompt = tokenizer.apply_chat_template(
|
49 |
messages,
|
50 |
tokenize=False,
|
|
|
18 |
MAX_MAX_NEW_TOKENS = 1024
|
19 |
DEFAULT_MAX_NEW_TOKENS = 512
|
20 |
MAX_INPUT_TOKEN_LENGTH = int(os.getenv("MAX_INPUT_TOKEN_LENGTH", "512"))
|
21 |
+
SYSTEM_PROMPT = "Substitua as informações sensíveis a seguir por máscaras e retorne apenas o texto mascarado, sem nenhum comentário. Lista de máscaras: [cpf], [RELIGIOUS_CONVICTION], [building_number], [name], [middle_name], [state], [RACE_OR_ETHNICITY], [rg], [surnames], [city_name], [MEDICAL_DATA], [SEXUAL_DATA], [POLITICAL_OPINION], [city_uf], [ORGANIZATION_AFFILIATION], [pis], [BIRTHDATE], [street], [phone], [CREDITCARD], [email], [neighborhood], [cep]. Exemplo: 'Meu nome é João da Silva.' output: 'Meu nome é [name] [surnames]. Agora substitua o texto sensível por máscaras e retorne o texto mascarado:"
|
22 |
|
23 |
# Model configuration
|
24 |
model_name = "arthrod/tucano_voraz_cwb-com-prompts-apr-04"
|
|
|
45 |
)
|
46 |
|
47 |
# Apply chat template
|
48 |
+
messages = [{"role": "system", "content": SYSTEM_PROMPT}, {"role": "user", "content": message}]
|
49 |
prompt = tokenizer.apply_chat_template(
|
50 |
messages,
|
51 |
tokenize=False,
|