elnasharomar2's picture
Update README.md
134a456
metadata
license: cc-by-nc-3.0
base_model: elnasharomar2/oknashar_arabic_keyword_extraction
tags:
  - generated_from_trainer
metrics:
  - precision
  - recall
  - f1
  - accuracy
model-index:
  - name: oknashar_arabic_keyword_extraction
    results: []
examples: null
widget:
  - text: >-
      الأدب المصري القديم  الأدب المصري القديم هو الأدب الذي كتب باللغات المصرية
      في مصر القديمة منذ عصر الفراعنة حتى سقوط مصر في قبضة الإمبراطورية
      الرومانية وهو يمثل مع الأدب السومري أقدم الآداب المعروفة  ظهرت الكتابة في
      مصر القديمة سواء الهيروغليفية أو الهيراطيقية لأول مرة في نهاية الألف
      الرابعة قبل الميلاد في مرحلة متأخرة من عصر ما قبل الأسرات وفي عصر الدولة
      القديمة شملت الأعمال الأدبية النصوص الجنائزية والرسائل والتراتيل الدينية
      والقصائد والسير الذاتية التي خلد بها الشخصيات البارزة أعمالهم وحتى عصر
      الدولة الوسطى لم يكن الأدب السردي المصري قد ظهر بحسب وصف عالم المصريات
      ريتشارد باركنسون كانت هناك  ثورة فكرية  نتيجة ظهور نتاج أدبي لطبقة الكتبة
      وهم النخبة العاملة في الحكومة والديوان الملكي للفرعون الحاكم ومع ذلك هناك
      اختلاف في الآراء بين العلماء المعاصرين حول اقتصار الأدب المصري القديم على
      إنتاج النخبة الاجتماعية والسياسية في البلاط الملكي  أصبحت اللغة المستخدمة
      في عصر الدولة الوسطى لغة مهجورة خلال عصر الدولة الحديثة عندما انتشرت
      الكتابة باللغة العامية إلا أنها ظلت تستخدم لتدوين التعاليم الدينية القديمة
      وظلت تستخدم حتى عصر مصر البطلمية شملت تلك الكتابات الحكايات الشعبية مثل
      قصة سنوحي والفلاح الفصيح بالإضافة إلى العديد من النصوص الهامة مثل وصايا
      أمنمحات وبحلول عصر الدولة الحديثة زينت الكتابات التذكارية التي تخلد أعمال
      الشخصيات الهامة جدران المعابد المقدسة والقبور والتي ازدهرت كحالة فريدة من
      الأدب  دون الأدب المصري القديم على طائفة واسعة من المواد شملت مخطوطات
      البردي وألواح الحجر الجيري والمواد السيراميكية والألواح الخشبية والصروح
      الحجرية الضخمة والتوابيت لم يصل إلى أيدينا من تلك النصوص إلا النذر اليسير
      يرجع ذلك إلى البيئة الرطبة التي يسببها الفيضان السنوي للنيل والتي لا تصلح
      لحفظ النقوش والبرديات بينما حفظت البيئة الصحراوية الجافة القطع المدفونة
      فيها   المخطوطات واللغات    الهيروغليفية والهيراطيقية والديموطيقية   اعتمد
      المصري القديم على اللغة الهيروغليفية ووليدتها الهيراطيقية كلغة كتابة منذ
      عصر الأسر المصرية المبكرة في أواخر الألفية 
    example_title: الجمله الاولي
  - text: >-
      منهجية الاستقصاء الإحصائي في مجال الإحصاء منهجية المسوح هي الحقل الذي يدرس
      جميع الجوانب المتعلقة بتصميم المسح بدءا من تصميم استمارة الاستقصاء وسحب
      العينة وانتهاء بنشر نتائج الاستطلاع جدير بالذكر أن الدراسات الاستقصائية
      واستطلاعات الرأي كلها مترادفات للمسوح بمعناها الأشمل ويتم جمع بيانات
      المسوح من عينة من أفراد المجتمع مسحوبة أو منتقاة بشكل علمي بهدف تمثيل
      المجتمع ككل أغراض المسوح تتعدد أغراض المسوح لتشمل العديد من المجالات حيث
      يوجد استطلاعات الرأي العام والتي قد تدرس الآراء فيما يتعلق بالقضايا
      السياسية أو الاقتصادية أو الاجتماعية وتستخدم أنواع أخرى من المسوح لأغراض
      علمية مثل الدراسات الاستقصائية التي توفر معلومات هامة لجميع أنواع حقول
      البحث على سبيل المثال أبحاث التسويق وعلم النفس وعلم الاجتماع والمسوح
      الصحية وقد يركز المسح الواحد على مواضيع مختلفة مثل تفضيلات المبحوثين على
      سبيل المثال لمرشح الرئاسة والسلوك التدخين أو معلومات واقعية مثل الدخل أما
      فيما يتعلق بجوانب المسح المختلفة والتي يهتم بها علم منهجية المسوح فإنه
      وبشكل عام تتعدد هذه الجوانب ولا تقتصر على الجانب الإحصائي فقط حيث أنه يمكن
      تقسيم هذا العلم إلى فرعين الأول يهتم بالجانب الإحصائي للمسح وهو يشمل تحديد
      مجتمع الدراسة وعملية سحب العينة الممثلة لهذا المجتمع بالإضافة إلى ذلك
      إعداد البيانات التي تم جمعها من المبحوثين واستخدام الاساليب الإحصائية
      السليمة لتحليل البيانات الثاني يهتم بتصميم استمارة المسح وأداة المسح
      مقابلة شخصية وجها لوجه أو مقابلة تليفونية أو باستخدام البريد  ودراسة
      التفاعلات السيكولوجية بين الباحثين والمبحوثين وتأثيرها على البيانات في نفس
      الوقت يهتم علم منهجية المسوح بشكل أساسي على دراسة ما يسمى بالخطأ الكلي
      للمسح Total Survey Error  والذي يركز على دراسة الأخطاء التي تحدث في خلال
      مراحل المسح وتقليلها والتي قد تؤثر على نتائج المسح وذلك في ضوء الميزانية
      المخصصة للمسح ومن هنا يمكن القول بأنه على الخبير بهذا المجال أو  من يطلق
      عليه اسم  Survey Methodologist 
    example_title: الجمله الثانية

oknashar_arabic_keyword_extraction

This model is a fine-tuned version of elnasharomar2/oknashar_arabic_keyword_extraction on the None dataset. It achieves the following results on the evaluation set:

  • Loss: 0.3199
  • Precision: 0.6325
  • Recall: 0.6737
  • F1: 0.6525
  • Accuracy: 0.9478

Model description

More information needed

Intended uses & limitations

More information needed

Training and evaluation data

More information needed

Training procedure

Training hyperparameters

The following hyperparameters were used during training:

  • learning_rate: 2e-05
  • train_batch_size: 4
  • eval_batch_size: 8
  • seed: 42
  • optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
  • lr_scheduler_type: linear
  • num_epochs: 5
  • mixed_precision_training: Native AMP

Training results

Training Loss Epoch Step Validation Loss Precision Recall F1 Accuracy
0.0336 1.0 2998 0.2695 0.6062 0.6123 0.6092 0.9437
0.0271 2.0 5996 0.2684 0.5870 0.6581 0.6205 0.9443
0.0157 3.0 8994 0.2843 0.6143 0.6756 0.6435 0.9466
0.0206 4.0 2998 0.2565 0.6230 0.6223 0.6227 0.9453
0.0155 5.0 5996 0.3030 0.6220 0.6484 0.6349 0.9466
0.0114 6.0 8994 0.3087 0.6120 0.6644 0.6371 0.9463
0.0192 7.0 2998 0.3107 0.5896 0.6544 0.6203 0.9426
0.0176 8.0 5996 0.3064 0.5897 0.6547 0.6205 0.9421
0.0158 9.0 8994 0.2739 0.6191 0.6466 0.6325 0.9458
0.012 10.0 11992 0.3105 0.6279 0.6682 0.6474 0.9466
0.009 11.0 14990 0.3199 0.6325 0.6737 0.6525 0.9478

Framework versions

  • Transformers 4.35.2
  • Pytorch 2.1.0+cu118
  • Datasets 2.15.0
  • Tokenizers 0.15.0