Add BERTopic model
Browse files- README.md +129 -0
- config.json +17 -0
- ctfidf.safetensors +3 -0
- ctfidf_config.json +0 -0
- topic_embeddings.safetensors +3 -0
- topics.json +0 -0
README.md
ADDED
@@ -0,0 +1,129 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
|
2 |
+
---
|
3 |
+
tags:
|
4 |
+
- bertopic
|
5 |
+
library_name: bertopic
|
6 |
+
pipeline_tag: text-classification
|
7 |
+
---
|
8 |
+
|
9 |
+
# FondoEsperanzav5.0
|
10 |
+
|
11 |
+
This is a [BERTopic](https://github.com/MaartenGr/BERTopic) model.
|
12 |
+
BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.
|
13 |
+
|
14 |
+
## Usage
|
15 |
+
|
16 |
+
To use this model, please install BERTopic:
|
17 |
+
|
18 |
+
```
|
19 |
+
pip install -U bertopic
|
20 |
+
```
|
21 |
+
|
22 |
+
You can use the model as follows:
|
23 |
+
|
24 |
+
```python
|
25 |
+
from bertopic import BERTopic
|
26 |
+
topic_model = BERTopic.load("JGamonalHML/FondoEsperanzav5.0")
|
27 |
+
|
28 |
+
topic_model.get_topic_info()
|
29 |
+
```
|
30 |
+
|
31 |
+
## Topic overview
|
32 |
+
|
33 |
+
* Number of topics: 60
|
34 |
+
* Number of training documents: 12530
|
35 |
+
|
36 |
+
<details>
|
37 |
+
<summary>Click here for an overview of all topics.</summary>
|
38 |
+
|
39 |
+
| Topic ID | Topic Keywords | Topic Frequency | Label |
|
40 |
+
|----------|----------------|-----------------|-------|
|
41 |
+
| -1 | servizio - planificando - basso - buon - interesse | 50 | -1_servizio_planificando_basso_buon |
|
42 |
+
| 0 | emprendedores - peque帽os - apoyo - asistencia - apoya | 2 | 0_emprendedores_peque帽os_apoyo_asistencia |
|
43 |
+
| 1 | startups - empresarial - crecimiento - empresariales - emprendimientos | 849 | 1_startups_empresarial_crecimiento_empresariales |
|
44 |
+
| 2 | pago - flexibles - opciones - semanal - mensual | 562 | 2_pago_flexibles_opciones_semanal |
|
45 |
+
| 3 | recursos - capital - oportunidades - networking - educaci贸n | 520 | 3_recursos_capital_oportunidades_networking |
|
46 |
+
| 4 | reuniones - miembros - usuario - presenciales - debido | 417 | 4_reuniones_miembros_usuario_presenciales |
|
47 |
+
| 5 | esperanza - fondo - fundaci贸n - apoyo - brinda | 446 | 5_esperanza_fondo_fundaci贸n_apoyo |
|
48 |
+
| 6 | tasas - bajas - inter茅s - tasa - baja | 562 | 6_tasas_bajas_inter茅s_tasa |
|
49 |
+
| 7 | texto - discute - utilidad - aborda - herramienta | 511 | 7_texto_discute_utilidad_aborda |
|
50 |
+
| 8 | financiamiento - financiera - financiaci贸n - financiero - ayuda | 433 | 8_financiamiento_financiera_financiaci贸n_financiero |
|
51 |
+
| 9 | experiencia - positiva - descrita - satisfactoria - usuario | 352 | 9_experiencia_positiva_descrita_satisfactoria |
|
52 |
+
| 10 | cr茅dito - acceso - facilidad - cr茅ditos - disponibilidad | 272 | 10_cr茅dito_acceso_facilidad_cr茅ditos |
|
53 |
+
| 11 | pr茅stamo - confianza - proceso - documentaci贸n - requisitos | 359 | 11_pr茅stamo_confianza_proceso_documentaci贸n |
|
54 |
+
| 12 | socios - asesores - hacia - compromiso - asesor | 270 | 12_socios_asesores_hacia_compromiso |
|
55 |
+
| 13 | bajo - inter茅s - pr茅stamos - tipo - pr茅stamo | 251 | 13_bajo_inter茅s_pr茅stamos_tipo |
|
56 |
+
| 14 | banco - comunitario - comunal - bancaria - calidad | 285 | 14_banco_comunitario_comunal_bancaria |
|
57 |
+
| 15 | negocio - iniciar - negocios - inicio - oportunidad | 270 | 15_negocio_iniciar_negocios_inicio |
|
58 |
+
| 16 | pymes - medianas - peque帽as - empresas - pyme | 469 | 16_pymes_medianas_peque帽as_empresas |
|
59 |
+
| 17 | emprendimiento - continuo - apoyo - emprendedur铆a - emprendedurismo | 115 | 17_emprendimiento_continuo_apoyo_emprendedur铆a |
|
60 |
+
| 18 | transparencia - discusi贸n - importancia - falta - transparente | 365 | 18_transparencia_discusi贸n_importancia_falta |
|
61 |
+
| 19 | herramienta - 煤til - empresarial - beneficiosa - crecimiento | 172 | 19_herramienta_煤til_empresarial_beneficiosa |
|
62 |
+
| 20 | personal - crecimiento - desarrollo - beneficio - experiencia | 391 | 20_personal_crecimiento_desarrollo_beneficio |
|
63 |
+
| 21 | pueden - individuos - bancarios - acceder - pr茅stamos | 330 | 21_pueden_individuos_bancarios_acceder |
|
64 |
+
| 22 | asistencia - proporcionada - significativa - recibida - proporciona | 294 | 22_asistencia_proporcionada_significativa_recibida |
|
65 |
+
| 23 | servicio - producto - hecha - calidad - recomendaci贸n | 308 | 23_servicio_producto_hecha_calidad |
|
66 |
+
| 24 | instituci贸n - seriedad - sistema - seria - reputaci贸n | 207 | 24_instituci贸n_seriedad_sistema_seria |
|
67 |
+
| 25 | bajos - tipos - intereses - inter茅s - pr茅stamos | 195 | 25_bajos_tipos_intereses_inter茅s |
|
68 |
+
| 26 | recomendaci贸n - calidad - hecho - basada - viable | 186 | 26_recomendaci贸n_calidad_hecho_basada |
|
69 |
+
| 27 | individuo - independencia - independiente - trabajadores - expresa | 144 | 27_individuo_independencia_independiente_trabajadores |
|
70 |
+
| 28 | peque帽as - empresas - medianas - propietarios - apoyo | 104 | 28_peque帽as_empresas_medianas_propietarios |
|
71 |
+
| 29 | detalles - espec铆ficos - especificar - experiencia - positiva | 277 | 29_detalles_espec铆ficos_especificar_experiencia |
|
72 |
+
| 30 | microemprendedores - microempresas - microempresarios - programa - ayuda | 79 | 30_microemprendedores_microempresas_microempresarios_programa |
|
73 |
+
| 31 | razones - cuales - buen - efectividad - opci贸n | 83 | 31_razones_cuales_buen_efectividad |
|
74 |
+
| 32 | inversi贸n - motivos - cuales - opci贸n - buena | 120 | 32_inversi贸n_motivos_cuales_opci贸n |
|
75 |
+
| 33 | grupo - miembros - equipo - recepci贸n - positiva | 106 | 33_grupo_miembros_equipo_recepci贸n |
|
76 |
+
| 34 | pagos - semanales - mensuales - cuotas - frecuencia | 182 | 34_pagos_semanales_mensuales_cuotas |
|
77 |
+
| 35 | responsabilidad - responsables - individuos - compromiso - grupo | 140 | 35_responsabilidad_responsables_individuos_compromiso |
|
78 |
+
| 36 | proyectos - proyecto - crecimiento - oportunidad - desarrollo | 217 | 36_proyectos_proyecto_crecimiento_oportunidad |
|
79 |
+
| 37 | fiabilidad - factores - explicaci贸n - confiabilidad - clave | 158 | 37_fiabilidad_factores_explicaci贸n_confiabilidad |
|
80 |
+
| 38 | seguridad - fiabilidad - caracter铆sticas - seguro - confianza | 110 | 38_seguridad_fiabilidad_caracter铆sticas_seguro |
|
81 |
+
| 39 | proporcionado - apoyo - gratitud - expresi贸n - recibido | 106 | 39_proporcionado_apoyo_gratitud_expresi贸n |
|
82 |
+
| 40 | asesor - parte - problemas - cambios - nuevo | 149 | 40_asesor_parte_problemas_cambios |
|
83 |
+
| 41 | econ贸mica - econ贸mico - apoyo - ayuda - asistencia | 173 | 41_econ贸mica_econ贸mico_apoyo_ayuda |
|
84 |
+
| 42 | d铆as - 15 - cada - frecuentes - pagar | 105 | 42_d铆as_15_cada_frecuentes |
|
85 |
+
| 43 | f谩cil - obtenci贸n - acceso - cr茅dito - fondos | 44 | 43_f谩cil_obtenci贸n_acceso_cr茅dito |
|
86 |
+
| 44 | comerciales - operaciones - comercial - empresariales - iniciando | 77 | 44_comerciales_operaciones_comercial_empresariales |
|
87 |
+
| 45 | hope - fund - asesores - fondo - sido | 73 | 45_hope_fund_asesores_fondo |
|
88 |
+
| 46 | empat铆a - falta - problemas - parte - hacia | 29 | 46_empat铆a_falta_problemas_parte |
|
89 |
+
| 47 | liderazgo - l铆der - grupo - decisi贸n - falta | 89 | 47_liderazgo_l铆der_grupo_decisi贸n |
|
90 |
+
| 48 | flexibilidad - velocidad - accesibilidad - clave - destacan | 39 | 48_flexibilidad_velocidad_accesibilidad_clave |
|
91 |
+
| 49 | firma - firmas - web - completar - proceso | 85 | 49_firma_firmas_web_completar |
|
92 |
+
| 50 | informaci贸n - clara - comunicaci贸n - claridad - provisi贸n | 49 | 50_informaci贸n_clara_comunicaci贸n_claridad |
|
93 |
+
| 51 | papeleo - m铆nimo - r谩pido - requerido - extenso | 108 | 51_papeleo_m铆nimo_r谩pido_requerido |
|
94 |
+
| 52 | sirve - herramienta - d铆a - 煤til - individualmente | 34 | 52_sirve_herramienta_d铆a_煤til |
|
95 |
+
| 53 | dicom - seguros - interesados - registro - utiliza | 44 | 53_dicom_seguros_interesados_registro |
|
96 |
+
| 54 | datos - ia - herramientas - eficiencia - an谩lisis | 28 | 54_datos_ia_herramientas_eficiencia |
|
97 |
+
| 55 | the - discusses - for - of - and | 44 | 55_the_discusses_for_of |
|
98 |
+
| 56 | apollo - ayudar - capacidad - realizar - organizado | 18 | 56_apollo_ayudar_capacidad_realizar |
|
99 |
+
| 57 | alternativo - opci贸n - alternativa - financiamiento - tradicional | 18 | 57_alternativo_opci贸n_alternativa_financiamiento |
|
100 |
+
| 58 | m铆nimo - inter茅s - proporcionados - niveles - m铆nima | 55 | 58_m铆nimo_inter茅s_proporcionados_niveles |
|
101 |
+
|
102 |
+
</details>
|
103 |
+
|
104 |
+
## Training hyperparameters
|
105 |
+
|
106 |
+
* calculate_probabilities: False
|
107 |
+
* language: None
|
108 |
+
* low_memory: False
|
109 |
+
* min_topic_size: 10
|
110 |
+
* n_gram_range: (1, 1)
|
111 |
+
* nr_topics: 60
|
112 |
+
* seed_topic_list: None
|
113 |
+
* top_n_words: 10
|
114 |
+
* verbose: False
|
115 |
+
* zeroshot_min_similarity: 0.7
|
116 |
+
* zeroshot_topic_list: None
|
117 |
+
|
118 |
+
## Framework versions
|
119 |
+
|
120 |
+
* Numpy: 2.2.5
|
121 |
+
* HDBSCAN: 0.8.40
|
122 |
+
* UMAP: 0.5.7
|
123 |
+
* Pandas: 2.2.3
|
124 |
+
* Scikit-Learn: 1.6.1
|
125 |
+
* Sentence-transformers: 4.1.0
|
126 |
+
* Transformers: 4.51.3
|
127 |
+
* Numba: 0.61.2
|
128 |
+
* Plotly: 6.0.1
|
129 |
+
* Python: 3.12.1
|
config.json
ADDED
@@ -0,0 +1,17 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"calculate_probabilities": false,
|
3 |
+
"language": null,
|
4 |
+
"low_memory": false,
|
5 |
+
"min_topic_size": 10,
|
6 |
+
"n_gram_range": [
|
7 |
+
1,
|
8 |
+
1
|
9 |
+
],
|
10 |
+
"nr_topics": 60,
|
11 |
+
"seed_topic_list": null,
|
12 |
+
"top_n_words": 10,
|
13 |
+
"verbose": false,
|
14 |
+
"zeroshot_min_similarity": 0.7,
|
15 |
+
"zeroshot_topic_list": null,
|
16 |
+
"embedding_model": "mrm8488/modernbert-embed-base-ft-sts-spanish-matryoshka-768-64"
|
17 |
+
}
|
ctfidf.safetensors
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:9dbfdb39dd051b25e43aedacfd0e586b48b8d049c5f09f6edc2ce26358cba073
|
3 |
+
size 537976
|
ctfidf_config.json
ADDED
The diff for this file is too large to render.
See raw diff
|
|
topic_embeddings.safetensors
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:e3f96706d199e25e1ceace02b6332cb7344098e15714ea6f8bf1aafe4dfabef2
|
3 |
+
size 184408
|
topics.json
ADDED
The diff for this file is too large to render.
See raw diff
|
|