MARTINI_enrich_BERTopic_sapereaudelt
This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.
Usage
To use this model, please install BERTopic:
pip install -U bertopic
You can use the model as follows:
from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_sapereaudelt")
topic_model.get_topic_info()
Topic overview
- Number of topics: 29
- Number of training documents: 3318
Click here for an overview of all topics.
Topic ID | Topic Keywords | Topic Frequency | Label |
---|---|---|---|
-1 | pandemija - vakcinacijos - covid - niekada - vaccine | 21 | -1_pandemija_vakcinacijos_covid_niekada |
0 | vakcinacijos - pfizer - reiskiniu - bmj - 2021 | 1907 | 0_vakcinacijos_pfizer_reiskiniu_bmj |
1 | kovid - pandemija - atviru - 2020 - visiskai | 126 | 1_kovid_pandemija_atviru_2020 |
2 | zelenskiui - ukrainieciai - rusijos - sviedinius - prezidentas | 114 | 2_zelenskiui_ukrainieciai_rusijos_sviedinius |
3 | klimatas - milankoviciaus - atmosferoje - antarktidoje - energijos | 112 | 3_klimatas_milankoviciaus_atmosferoje_antarktidoje |
4 | konstituciniai - ministerija - lietuviu - advokatai - pandemiju | 107 | 4_konstituciniai_ministerija_lietuviu_advokatai |
5 | protestai - policininku - tukstanciai - demonstracijoje - priesais | 77 | 5_protestai_policininku_tukstanciai_demonstracijoje |
6 | energijos - elektromobiliu - tesla - skaitikliai - generatoriu | 69 | 6_energijos_elektromobiliu_tesla_skaitikliai |
7 | twitter - zurnalistai - socialiniu - neteiseta - julianas | 65 | 7_twitter_zurnalistai_socialiniu_neteiseta |
8 | koronavirusiniu - izraelis - injekcijos - ministerija - ilgalaikis | 53 | 8_koronavirusiniu_izraelis_injekcijos_ministerija |
9 | rusija - sanctions - europoje - arabija - naftos | 49 | 9_rusija_sanctions_europoje_arabija |
10 | bankas - banknotas - moneta - savininkas - euro | 48 | 10_bankas_banknotas_moneta_savininkas |
11 | vaccinated - fatalities - 2021 - injection - mhra | 45 | 11_vaccinated_fatalities_2021_injection |
12 | vaccine - poison - channels - pandamned - cpn | 42 | 12_vaccine_poison_channels_pandamned |
13 | vakcinacijos - epidemijoje - measles - dvylikameciui - reklamuojamos | 41 | 13_vakcinacijos_epidemijoje_measles_dvylikameciui |
14 | schweden - pandemija - austrijoje - skaicius - 2020 | 40 | 14_schweden_pandemija_austrijoje_skaicius |
15 | europarlamentarai - pfizer - vakcinai - komisijos - susipazinti | 39 | 15_europarlamentarai_pfizer_vakcinai_komisijos |
16 | ekonomistai - recesijos - kapitalistams - persitvarkymas - kaizeriui | 35 | 16_ekonomistai_recesijos_kapitalistams_persitvarkymas |
17 | austrijoje - vakcinacija - tageszeitung - vyriausybei - krizes | 35 | 17_austrijoje_vakcinacija_tageszeitung_vyriausybei |
18 | asmeniskai - citata - praturteja - nepasiduosiu - pavieniai | 34 | 18_asmeniskai_citata_praturteja_nepasiduosiu |
19 | fauci - 2020 - amerikieciu - laboratorijoje - maziausiai | 34 | 19_fauci_2020_amerikieciu_laboratorijoje |
20 | vaccine - protests - romania - passports - mandatory | 33 | 20_vaccine_protests_romania_passports |
21 | australijos - melburnas - naujajame - revakcinavimo - reguliaraus | 31 | 21_australijos_melburnas_naujajame_revakcinavimo |
22 | ivermektinu - remdisivir - koinfekcija - suvalde - indonezijoje | 30 | 22_ivermektinu_remdisivir_koinfekcija_suvalde |
23 | italija - draghi - konstitucijai - trieste - nunzia | 29 | 23_italija_draghi_konstitucijai_trieste |
24 | izraelieciai - palestinieciu - netanyahu - hamas - konflikta | 27 | 24_izraelieciai_palestinieciu_netanyahu_hamas |
25 | europarlamentaras - komisijai - pilieciai - korupcijos - elektroninio | 27 | 25_europarlamentaras_komisijai_pilieciai_korupcijos |
26 | kiausiniai - pasiklausyti - apsakyti - atvykome - nusprendem | 25 | 26_kiausiniai_pasiklausyti_apsakyti_atvykome |
27 | gatesas - zuckerbergas - billo - paskutiniai - finansuoja | 23 | 27_gatesas_zuckerbergas_billo_paskutiniai |
Training hyperparameters
- calculate_probabilities: True
- language: None
- low_memory: False
- min_topic_size: 10
- n_gram_range: (1, 1)
- nr_topics: None
- seed_topic_list: None
- top_n_words: 10
- verbose: False
- zeroshot_min_similarity: 0.7
- zeroshot_topic_list: None
Framework versions
- Numpy: 1.26.4
- HDBSCAN: 0.8.40
- UMAP: 0.5.7
- Pandas: 2.2.3
- Scikit-Learn: 1.5.2
- Sentence-transformers: 3.3.1
- Transformers: 4.46.3
- Numba: 0.60.0
- Plotly: 5.24.1
- Python: 3.10.12
- Downloads last month
- 3