Spaces:

AlirezaF138
/

Hazm

Sleeping

App Files Files Community

AlirezaF138 commited on Jan 17

Commit

3037d70

verified ·

1 Parent(s): ea34410

Update app.py

Browse files

Files changed (1) hide show

app.py +16 -14

app.py CHANGED Viewed

@@ -5,7 +5,7 @@ from hazm import Normalizer, word_tokenize, Lemmatizer, Chunker
 lemmatizer = Lemmatizer()
 chunker = Chunker(model='resources/chunker.model')
-def process_text(text, operations, correct_spacing, remove_diacritics, remove_specials_chars, decrease_repeated_chars, persian_style, persian_numbers, unicodes_replacement, seperate_mi):
     # Initialize the Normalizer with user-selected parameters
     normalizer = Normalizer(
         correct_spacing=correct_spacing,
@@ -17,20 +17,22 @@ def process_text(text, operations, correct_spacing, remove_diacritics, remove_sp
         unicodes_replacement=unicodes_replacement,
         seperate_mi=seperate_mi
     )
-    result = {}
-    if 'normalize' in operations:
-        text = normalizer.normalize(text)
-        result['Normalized Text'] = text
-    if 'tokenize' in operations:
         tokens = word_tokenize(text)
-        result['Tokens'] = tokens
-    if 'lemmatize' in operations:
         lemmas = [lemmatizer.lemmatize(token) for token in word_tokenize(text)]
-        result['Lemmas'] = lemmas
-    if 'chunk' in operations:
         pos_tags = word_tokenize(text)
         chunks = chunker.parse(pos_tags)
-        result['Chunks'] = str(chunks)
     return result
 # Define Gradio interface
@@ -39,7 +41,7 @@ iface = gr.Interface(
     fn=process_text,
     inputs=[
         gr.Textbox(lines=10, label="Input Text"),
-        gr.CheckboxGroup(operations, label="Operations"),
         gr.Checkbox(value=True, label="Correct Spacing", interactive=True),
         gr.Checkbox(value=True, label="Remove Diacritics", interactive=True),
         gr.Checkbox(value=True, label="Remove Special Characters", interactive=True),
@@ -49,9 +51,9 @@ iface = gr.Interface(
         gr.Checkbox(value=True, label="Unicodes Replacement", interactive=True),
         gr.Checkbox(value=True, label="Separate 'می'", interactive=True)
     ],
-    outputs="json",
     title="Persian Text Processor with Hazm",
-    description="Select operations and normalization parameters to perform on the input text using Hazm."
 )
 if __name__ == "__main__":

 lemmatizer = Lemmatizer()
 chunker = Chunker(model='resources/chunker.model')
+def process_text(text, operation, correct_spacing, remove_diacritics, remove_specials_chars, decrease_repeated_chars, persian_style, persian_numbers, unicodes_replacement, seperate_mi):
     # Initialize the Normalizer with user-selected parameters
     normalizer = Normalizer(
         correct_spacing=correct_spacing,
         unicodes_replacement=unicodes_replacement,
         seperate_mi=seperate_mi
     )
+    result = ""
+    if operation == "normalize":
+        result = normalizer.normalize(text)
+    elif operation == "tokenize":
         tokens = word_tokenize(text)
+        result = " ".join(tokens)  # Show tokens as a space-separated string
+    elif operation == "lemmatize":
         lemmas = [lemmatizer.lemmatize(token) for token in word_tokenize(text)]
+        result = " ".join(lemmas)  # Show lemmas as a space-separated string
+    elif operation == "chunk":
         pos_tags = word_tokenize(text)
         chunks = chunker.parse(pos_tags)
+        result = str(chunks)  # Show chunks as text
     return result
 # Define Gradio interface
     fn=process_text,
     inputs=[
         gr.Textbox(lines=10, label="Input Text"),
+        gr.Radio(operations, label="Select Operation", type="value"),  # Radio button to select one operation at a time
         gr.Checkbox(value=True, label="Correct Spacing", interactive=True),
         gr.Checkbox(value=True, label="Remove Diacritics", interactive=True),
         gr.Checkbox(value=True, label="Remove Special Characters", interactive=True),
         gr.Checkbox(value=True, label="Unicodes Replacement", interactive=True),
         gr.Checkbox(value=True, label="Separate 'می'", interactive=True)
     ],
+    outputs=gr.Textbox(label="Processed Text", interactive=False, lines=10),  # Output as copyable text
     title="Persian Text Processor with Hazm",
+    description="Select an operation and normalization parameters to process the input text using Hazm."
 )
 if __name__ == "__main__":