MARTINI_enrich_BERTopic_sapereaudelt

This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.

Usage

To use this model, please install BERTopic:

pip install -U bertopic

You can use the model as follows:

from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_sapereaudelt")

topic_model.get_topic_info()

Topic overview

  • Number of topics: 29
  • Number of training documents: 3318
Click here for an overview of all topics.
Topic ID Topic Keywords Topic Frequency Label
-1 pandemija - vakcinacijos - covid - niekada - vaccine 21 -1_pandemija_vakcinacijos_covid_niekada
0 vakcinacijos - pfizer - reiskiniu - bmj - 2021 1907 0_vakcinacijos_pfizer_reiskiniu_bmj
1 kovid - pandemija - atviru - 2020 - visiskai 126 1_kovid_pandemija_atviru_2020
2 zelenskiui - ukrainieciai - rusijos - sviedinius - prezidentas 114 2_zelenskiui_ukrainieciai_rusijos_sviedinius
3 klimatas - milankoviciaus - atmosferoje - antarktidoje - energijos 112 3_klimatas_milankoviciaus_atmosferoje_antarktidoje
4 konstituciniai - ministerija - lietuviu - advokatai - pandemiju 107 4_konstituciniai_ministerija_lietuviu_advokatai
5 protestai - policininku - tukstanciai - demonstracijoje - priesais 77 5_protestai_policininku_tukstanciai_demonstracijoje
6 energijos - elektromobiliu - tesla - skaitikliai - generatoriu 69 6_energijos_elektromobiliu_tesla_skaitikliai
7 twitter - zurnalistai - socialiniu - neteiseta - julianas 65 7_twitter_zurnalistai_socialiniu_neteiseta
8 koronavirusiniu - izraelis - injekcijos - ministerija - ilgalaikis 53 8_koronavirusiniu_izraelis_injekcijos_ministerija
9 rusija - sanctions - europoje - arabija - naftos 49 9_rusija_sanctions_europoje_arabija
10 bankas - banknotas - moneta - savininkas - euro 48 10_bankas_banknotas_moneta_savininkas
11 vaccinated - fatalities - 2021 - injection - mhra 45 11_vaccinated_fatalities_2021_injection
12 vaccine - poison - channels - pandamned - cpn 42 12_vaccine_poison_channels_pandamned
13 vakcinacijos - epidemijoje - measles - dvylikameciui - reklamuojamos 41 13_vakcinacijos_epidemijoje_measles_dvylikameciui
14 schweden - pandemija - austrijoje - skaicius - 2020 40 14_schweden_pandemija_austrijoje_skaicius
15 europarlamentarai - pfizer - vakcinai - komisijos - susipazinti 39 15_europarlamentarai_pfizer_vakcinai_komisijos
16 ekonomistai - recesijos - kapitalistams - persitvarkymas - kaizeriui 35 16_ekonomistai_recesijos_kapitalistams_persitvarkymas
17 austrijoje - vakcinacija - tageszeitung - vyriausybei - krizes 35 17_austrijoje_vakcinacija_tageszeitung_vyriausybei
18 asmeniskai - citata - praturteja - nepasiduosiu - pavieniai 34 18_asmeniskai_citata_praturteja_nepasiduosiu
19 fauci - 2020 - amerikieciu - laboratorijoje - maziausiai 34 19_fauci_2020_amerikieciu_laboratorijoje
20 vaccine - protests - romania - passports - mandatory 33 20_vaccine_protests_romania_passports
21 australijos - melburnas - naujajame - revakcinavimo - reguliaraus 31 21_australijos_melburnas_naujajame_revakcinavimo
22 ivermektinu - remdisivir - koinfekcija - suvalde - indonezijoje 30 22_ivermektinu_remdisivir_koinfekcija_suvalde
23 italija - draghi - konstitucijai - trieste - nunzia 29 23_italija_draghi_konstitucijai_trieste
24 izraelieciai - palestinieciu - netanyahu - hamas - konflikta 27 24_izraelieciai_palestinieciu_netanyahu_hamas
25 europarlamentaras - komisijai - pilieciai - korupcijos - elektroninio 27 25_europarlamentaras_komisijai_pilieciai_korupcijos
26 kiausiniai - pasiklausyti - apsakyti - atvykome - nusprendem 25 26_kiausiniai_pasiklausyti_apsakyti_atvykome
27 gatesas - zuckerbergas - billo - paskutiniai - finansuoja 23 27_gatesas_zuckerbergas_billo_paskutiniai

Training hyperparameters

  • calculate_probabilities: True
  • language: None
  • low_memory: False
  • min_topic_size: 10
  • n_gram_range: (1, 1)
  • nr_topics: None
  • seed_topic_list: None
  • top_n_words: 10
  • verbose: False
  • zeroshot_min_similarity: 0.7
  • zeroshot_topic_list: None

Framework versions

  • Numpy: 1.26.4
  • HDBSCAN: 0.8.40
  • UMAP: 0.5.7
  • Pandas: 2.2.3
  • Scikit-Learn: 1.5.2
  • Sentence-transformers: 3.3.1
  • Transformers: 4.46.3
  • Numba: 0.60.0
  • Plotly: 5.24.1
  • Python: 3.10.12
Downloads last month
3
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support