Spaces:

AndrewLam489
/

CTP_ALam

Sleeping

AndrewLam489 commited on Nov 7, 2024

Commit

92c3a1e

verified ·

1 Parent(s): 3f07df6

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,33 +1,33 @@
 import streamlit as st
 from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
-# Ensure the model and tokenizer are available
-tokenizer = AutoTokenizer.from_pretrained("facebook/mbart-large-50", use_fast=True)
 model = AutoModelForSeq2SeqLM.from_pretrained("facebook/mbart-large-50")
 def translate_to_japanese(english_text):
-    # Translation prompt
-    input_text = f"translate English to Japanese: {english_text}"
     # Tokenize input text
     inputs = tokenizer(input_text, return_tensors="pt", padding=True, truncation=True)
-    # Generate translation
     outputs = model.generate(inputs['input_ids'], max_length=128, num_beams=4, early_stopping=True)
     # Decode the generated token IDs into a string
     translated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
     return translated_text
 # Streamlit UI
 st.title("English to Japanese Translator")
 st.write("This app translates English sentences to Japanese using the mBART model.")
-# User input
 english_sentence = st.text_area("Enter English sentence:", "")
-# Translate and display result
 if english_sentence:
     with st.spinner("Translating..."):
         translation = translate_to_japanese(english_sentence)

 import streamlit as st
 from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
+# Load model and tokenizer
+tokenizer = AutoTokenizer.from_pretrained("facebook/mbart-large-50")
 model = AutoModelForSeq2SeqLM.from_pretrained("facebook/mbart-large-50")
 def translate_to_japanese(english_text):
+    # Add language tokens for translation (from English > to Japanese)
+    input_text = f">en< {english_text} </s>"
     # Tokenize input text
     inputs = tokenizer(input_text, return_tensors="pt", padding=True, truncation=True)
+    # Generate translation (the model's output should be a token sequence for the translation)
     outputs = model.generate(inputs['input_ids'], max_length=128, num_beams=4, early_stopping=True)
     # Decode the generated token IDs into a string
     translated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
     return translated_text
 # Streamlit UI
 st.title("English to Japanese Translator")
 st.write("This app translates English sentences to Japanese using the mBART model.")
+# Create an input box for the user to enter an English sentence
 english_sentence = st.text_area("Enter English sentence:", "")
+# Translate and display the result
 if english_sentence:
     with st.spinner("Translating..."):
         translation = translate_to_japanese(english_sentence)