--- license: mit language: ms tags: - text-classification - multi-label - malay - fact-checking - misinformation - bert datasets: - checkfakta10 model-index: - name: 10FactCheck (Malay) results: [] --- # 10FactCheck (Malay Multi-label Fact-checking) `10FactCheck` ialah model Bahasa Melayu yang dilatih untuk **multi-label classification** — mengenal pasti 10 kriteria utama dalam penilaian fakta sesuatu maklumat atau berita tular. Ia berguna untuk proses semakan fakta automatik dalam konteks Malaysia. ## 🔍 Senarai Label Model ini meramalkan 10 label berikut: | Label | Maksud | |----------------------|--------| | `has_fact_value` | Adakah maklumat ini bernilai untuk semakan fakta? | | `causes_confusion` | Adakah boleh menyebabkan kekeliruan? | | `causes_chaos` | Adakah boleh mencetuskan huru-hara? | | `affects_government` | Adakah berkait dengan kerajaan/pentadbiran? | | `impacts_economy` | Adakah memberi impak ekonomi segera? | | `breaks_law` | Adakah melanggar undang-undang? | | `public_interest` | Adakah dalam kepentingan awam? | | `life_threatening` | Adakah membahayakan nyawa? | | `already_viral` | Adakah sudah tular? | | `time_sensitive` | Adakah perkara ini perlu disemak segera? | --- ## 🧠 Model Details - Base model: `rmtariq/ft-Malay-bert` - Fine-tuned by: **Dr. RM Tariqi @ Temight™** - Dataset: `CheckFakta10.csv` (berita viral + kolum manual dari pemerhati fakta) - Trained with: Hugging Face Transformers, PyTorch, Colab A100 --- ## 📦 How to Use ```python from transformers import pipeline classifier = pipeline("text-classification", model="rmtariq/10factcheck", tokenizer="rmtariq/10factcheck", top_k=None, function_to_apply="sigmoid") text = "Kenyataan ini tular di media sosial dan berk