MARTINI_enrich_BERTopic_haberalert

This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.

Usage

To use this model, please install BERTopic:

pip install -U bertopic

You can use the model as follows:

from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_haberalert")

topic_model.get_topic_info()

Topic overview

  • Number of topics: 29
  • Number of training documents: 4903
Click here for an overview of all topics.
Topic ID Topic Keywords Topic Frequency Label
-1 erdogan - kılıcdaroglu - bakanı - istanbul - imamoglu 20 -1_erdogan_kılıcdaroglu_bakanı_istanbul
0 erdogan - kılıcdaroglu - sayımı - cumhurbaskanını - sırbistan 3152 0_erdogan_kılıcdaroglu_sayımı_cumhurbaskanını
1 pakistanlılar - tiktok - kadınlarını - sarıgul - paylastıgı 145 1_pakistanlılar_tiktok_kadınlarını_sarıgul
2 fiyatı - yılın - lirası - acıklandı - bankası 127 2_fiyatı_yılın_lirası_acıklandı
3 kılıcdaroglu - partisi - cevabını - merkezi - chp 115 3_kılıcdaroglu_partisi_cevabını_merkezi
4 dolarlık - binance - stablecoin - borsaları - euro 110 4_dolarlık_binance_stablecoin_borsaları
5 kızına - cezasına - sarıkcı - carptırıldı - sevgilisi 108 5_kızına_cezasına_sarıkcı_carptırıldı
6 galatasaray - sampiyonlar - futbolcusu - takımımız - benzema 102 6_galatasaray_sampiyonlar_futbolcusu_takımımız
7 hırsızlıktır - yasatamadılar - sarkıcı - muharrem - genclerimizi 90 7_hırsızlıktır_yasatamadılar_sarkıcı_muharrem
8 zelensky - cavusoglu - diplomatların - rusya - saldırmayacagız 85 8_zelensky_cavusoglu_diplomatların_rusya
9 kapılamayız - calısanlarımızın - imamoglu - istanbul - kolelestirildigimizi 85 9_kapılamayız_calısanlarımızın_imamoglu_istanbul
10 adaylıgı - yansıtacak - davutoglu - cumhurbaskanlıgı - sıgınmacı 76 10_adaylıgı_yansıtacak_davutoglu_cumhurbaskanlıgı
11 partiye - erdogan - kılıcdaroglu - cumhurbaskanlıgı - dagılımı 74 11_partiye_erdogan_kılıcdaroglu_cumhurbaskanlıgı
12 altaylı - satafatı - calıstıgımı - saldırganlarla - basarısızsınız 68 12_altaylı_satafatı_calıstıgımı_saldırganlarla
13 bombalı - teroristlerin - irak - operasyonuyla - suleymaniye 62 13_bombalı_teroristlerin_irak_operasyonuyla
14 ankara - buyuksehir - kararları - mansur - politikaları 55 14_ankara_buyuksehir_kararları_mansur
15 rusya - harkov - silahlarla - hızlı - tankı 53 15_rusya_harkov_silahlarla_hızlı
16 kadıkoy - konvoyundaki - kamyonetiyle - gagalarını - otobus 46 16_kadıkoy_konvoyundaki_kamyonetiyle_gagalarını
17 okulları - diyarbakır - hayırseverler - gaziantep - talaytepe 44 17_okulları_diyarbakır_hayırseverler_gaziantep
18 mariupol - ukraynalı - azov - guneybatı - merkezinden 38 18_mariupol_ukraynalı_azov_guneybatı
19 bonusları - casinovale - 000tl - mega - kanalımızı 37 19_bonusları_casinovale_000tl_mega
20 kılıcdaroglu - kırmadım - kayıplarımızı - olmadım - cıkarabiliriz 34 20_kılıcdaroglu_kırmadım_kayıplarımızı_olmadım
21 yakalanacagını - polisin - hırsızlık - silahıyla - beyazıt 34 21_yakalanacagını_polisin_hırsızlık_silahıyla
22 kahramanlarını - canakkale - ataturk - yayınlanacagını - ogretmenlerimizin 27 22_kahramanlarını_canakkale_ataturk_yayınlanacagını
23 bayragını - etkinlikleri - lgbti - kadınımızı - kaptırmıssınız 26 23_bayragını_etkinlikleri_lgbti_kadınımızı
24 fiyatlarındaki - dolandırdıgı - emlakcılar - taksitleri - kirası 25 24_fiyatlarındaki_dolandırdıgı_emlakcılar_taksitleri
25 kızımın - istismarcılarına - imansızlar - vakfı - fatıma 23 25_kızımın_istismarcılarına_imansızlar_vakfı
26 bankası - kredilerin - maliyetinin - edebilecekleri - borclarımı 22 26_bankası_kredilerin_maliyetinin_edebilecekleri
27 demokratiklestiremezsin - cıkarsaydık - ifsaatları - hdp - kurumlarını 20 27_demokratiklestiremezsin_cıkarsaydık_ifsaatları_hdp

Training hyperparameters

  • calculate_probabilities: True
  • language: None
  • low_memory: False
  • min_topic_size: 10
  • n_gram_range: (1, 1)
  • nr_topics: None
  • seed_topic_list: None
  • top_n_words: 10
  • verbose: False
  • zeroshot_min_similarity: 0.7
  • zeroshot_topic_list: None

Framework versions

  • Numpy: 1.26.4
  • HDBSCAN: 0.8.40
  • UMAP: 0.5.7
  • Pandas: 2.2.3
  • Scikit-Learn: 1.5.2
  • Sentence-transformers: 3.3.1
  • Transformers: 4.46.3
  • Numba: 0.60.0
  • Plotly: 5.24.1
  • Python: 3.10.12
Downloads last month
-
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support