linagora
/

Barcha-7B-Instruct

@@ -39,7 +39,7 @@ pipe = pipeline(
 )
 messages = [
-    {"role": "user", "content": 'وين تجي تونس؟'},
 ]
 outputs = pipe(messages, max_new_tokens=128,  temperature=0.0)
@@ -47,7 +47,7 @@ assistant_response = outputs[0]["generated_text"][-1]["content"].strip()
 print(assistant_response)
 ```
 ```
-- Response:تونس هي بلاد في شمال إفريقيا. جات على الساحل متاع البحر الأبيض المتوسط.
 ```
 #### Running the model on a single / multi GPU
 ```python
@@ -63,7 +63,7 @@ model = AutoModelForCausalLM.from_pretrained(
 tokenizer = AutoTokenizer.from_pretrained(model_id)
 messages = [
-    {"role": "user", "content":  "وين تجي تونس؟"},
 ]
 input_ids = tokenizer.apply_chat_template(messages, return_tensors="pt", return_dict=True , add_generation_prompt=True).to(model.device)
@@ -73,7 +73,7 @@ outputs = model.generate(**input_ids, max_new_tokens=128)
 print(tokenizer.decode(outputs[0]))
 ```
 ```
-- Response:تونس هي بلاد في شمال إفريقيا. جات على الساحل متاع البحر الأبيض المتوسط. هي بلاد عندها تاريخ غني وهي من البلدان اللي فيها تنوع ثقافي كبير. تونس معروفة بالبحر متاعها وجمالها الطبيعي. هي بلاد فيها تنوع ثقافي كبير وفيها تنوع لغوي زادة. اللغة الرسمية متاع تونس هي العربية وفيها برشا متاع اللهجات اللي كيهضرو بيها الناس. تونس بلاد فيها تنوع ثقافي كبير وفيها تنوع لغوي زادة.
 ```
 ## Citations
 When using this model ** Barcha-7B-Instruct **, please cite:
@@ -81,7 +81,7 @@ When using this model ** Barcha-7B-Instruct **, please cite:
 ```bibtex
 @model{linagora2025LLM-tn,
   author = {Wajdi Ghezaiel and Jean-Pierre Lorré},
-  title = {Barcha-7B-Instruct :Tunisian Arabic Derja LLM},
   year = {2025},
   month = {July},
   url = {https://huggingface.co/datasets/linagora/Barcha-7B-Instruct}

 )
 messages = [
+    {"role": "user", "content": ' شنو معنى برشا'},
 ]
 outputs = pipe(messages, max_new_tokens=128,  temperature=0.0)
 print(assistant_response)
 ```
 ```
+- Response:برشّا هي كلمة تعني كتر من واحد حاجة
 ```
 #### Running the model on a single / multi GPU
 ```python
 tokenizer = AutoTokenizer.from_pretrained(model_id)
 messages = [
+    {"role": "user", "content":  "شنو معنى لاباس""},
 ]
 input_ids = tokenizer.apply_chat_template(messages, return_tensors="pt", return_dict=True , add_generation_prompt=True).to(model.device)
 print(tokenizer.decode(outputs[0]))
 ```
 ```
+- Response:لاباس هو كلمة جاية من العربية، معناها هل أنت بخير
 ```
 ## Citations
 When using this model ** Barcha-7B-Instruct **, please cite:
 ```bibtex
 @model{linagora2025LLM-tn,
   author = {Wajdi Ghezaiel and Jean-Pierre Lorré},
+  title = {Barcha-7B-Instruct :Tunisian Arabic Derja LLM based on Qwen2-7B},
   year = {2025},
   month = {July},
   url = {https://huggingface.co/datasets/linagora/Barcha-7B-Instruct}