Add BERTopic model
Browse files- README.md +142 -0
- config.json +17 -0
- ctfidf.safetensors +3 -0
- ctfidf_config.json +0 -0
- topic_embeddings.safetensors +3 -0
- topics.json +0 -0
README.md
ADDED
@@ -0,0 +1,142 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
|
2 |
+
---
|
3 |
+
tags:
|
4 |
+
- bertopic
|
5 |
+
library_name: bertopic
|
6 |
+
pipeline_tag: text-classification
|
7 |
+
---
|
8 |
+
|
9 |
+
# FondoEsperanzav3.0
|
10 |
+
|
11 |
+
This is a [BERTopic](https://github.com/MaartenGr/BERTopic) model.
|
12 |
+
BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.
|
13 |
+
|
14 |
+
## Usage
|
15 |
+
|
16 |
+
To use this model, please install BERTopic:
|
17 |
+
|
18 |
+
```
|
19 |
+
pip install -U bertopic
|
20 |
+
```
|
21 |
+
|
22 |
+
You can use the model as follows:
|
23 |
+
|
24 |
+
```python
|
25 |
+
from bertopic import BERTopic
|
26 |
+
topic_model = BERTopic.load("JGamonalHML/FondoEsperanzav3.0")
|
27 |
+
|
28 |
+
topic_model.get_topic_info()
|
29 |
+
```
|
30 |
+
|
31 |
+
## Topic overview
|
32 |
+
|
33 |
+
* Number of topics: 73
|
34 |
+
* Number of training documents: 12530
|
35 |
+
|
36 |
+
<details>
|
37 |
+
<summary>Click here for an overview of all topics.</summary>
|
38 |
+
|
39 |
+
| Topic ID | Topic Keywords | Topic Frequency | Label |
|
40 |
+
|----------|----------------|-----------------|-------|
|
41 |
+
| -1 | of - that - allows - atmosfera - also | 57 | -1_of_that_allows_atmosfera |
|
42 |
+
| 0 | socios - pagar - falta - problemas - cuotas | 4 | 0_socios_pagar_falta_problemas |
|
43 |
+
| 1 | recomendaci贸n - bajas - tasas - inter茅s - basada | 325 | 1_recomendaci贸n_bajas_tasas_inter茅s |
|
44 |
+
| 2 | ayuda - significativa - gratitud - financiamiento - esperanza | 362 | 2_ayuda_significativa_gratitud_financiamiento |
|
45 |
+
| 3 | grupo - ambiente - falta - autor - fondo | 404 | 3_grupo_ambiente_falta_autor |
|
46 |
+
| 4 | discuta - financiar - proporcionadas - fiabilidad - texto | 149 | 4_discuta_financiar_proporcionadas_fiabilidad |
|
47 |
+
| 5 | asesor - parte - comunicaci贸n - miembros - falta | 165 | 5_asesor_parte_comunicaci贸n_miembros |
|
48 |
+
| 6 | usuario - responsabilidad - miembros - cuota - grupo | 174 | 6_usuario_responsabilidad_miembros_cuota |
|
49 |
+
| 7 | texto - discute - trata - acceder - beneficio | 145 | 7_texto_discute_trata_acceder |
|
50 |
+
| 8 | beneficiosa - iniciar - satisfecho - adquirir - negocio | 178 | 8_beneficiosa_iniciar_satisfecho_adquirir |
|
51 |
+
| 9 | comparaci贸n - inter茅s - recomienda - buen - bajas | 184 | 9_comparaci贸n_inter茅s_recomienda_buen |
|
52 |
+
| 10 | asistencia - emprendedores - significativa - financiera - emprendimiento | 217 | 10_asistencia_emprendedores_significativa_financiera |
|
53 |
+
| 11 | comunitario - miembros - banco - responsable - m铆nimo | 518 | 11_comunitario_miembros_banco_responsable |
|
54 |
+
| 12 | positiva - experiencia - proporcionada - asistencia - general | 131 | 12_positiva_experiencia_proporcionada_asistencia |
|
55 |
+
| 13 | virtuales - incluyendo - medianos - reuniones - eficacia | 305 | 13_virtuales_incluyendo_medianos_reuniones |
|
56 |
+
| 14 | educativo - microemprendedores - m贸dulos - respaldo - educativos | 102 | 14_educativo_microemprendedores_m贸dulos_respaldo |
|
57 |
+
| 15 | confianza - prestado - gesti贸n - todas - dinero | 96 | 15_confianza_prestado_gesti贸n_todas |
|
58 |
+
| 16 | herramientas - operaciones - eficiencia - datos - tareas | 133 | 16_herramientas_operaciones_eficiencia_datos |
|
59 |
+
| 17 | f谩cil - acceso - financiaci贸n - obtenci贸n - cr茅dito | 134 | 17_f谩cil_acceso_financiaci贸n_obtenci贸n |
|
60 |
+
| 18 | destacando - tradicionales - carecen - aborda - papel | 160 | 18_destacando_tradicionales_carecen_aborda |
|
61 |
+
| 19 | pago - flexible - fechas - opciones - flexibles | 286 | 19_pago_flexible_fechas_opciones |
|
62 |
+
| 20 | oportunidad - negocio - mejorar - crecimiento - emprendimiento | 194 | 20_oportunidad_negocio_mejorar_crecimiento |
|
63 |
+
| 21 | destaca - fe - preocupaci贸n - empleado - emprendedur铆a | 479 | 21_destaca_fe_preocupaci贸n_empleado |
|
64 |
+
| 22 | experiencia - personal - positiva - detalles - negativa | 114 | 22_experiencia_personal_positiva_detalles |
|
65 |
+
| 23 | cr茅dito - acceso - proceso - bancario - comenzar | 251 | 23_cr茅dito_acceso_proceso_bancario |
|
66 |
+
| 24 | apoyo - emprendedores - significativo - peque帽os - brinda | 392 | 24_apoyo_emprendedores_significativo_peque帽os |
|
67 |
+
| 25 | sistema - situaci贸n - pagos - atrasados - consecuencias | 788 | 25_sistema_situaci贸n_pagos_atrasados |
|
68 |
+
| 26 | medianas - peque帽as - pymes - empresas - seguridad | 105 | 26_medianas_peque帽as_pymes_empresas |
|
69 |
+
| 27 | empleo - startups - emprendedur铆a - ayuda - sugiere | 203 | 27_empleo_startups_emprendedur铆a_ayuda |
|
70 |
+
| 28 | problemas - apoyar - avance - buscan - evaluaci贸n | 93 | 28_problemas_apoyar_avance_buscan |
|
71 |
+
| 29 | ofreciendo - hecho - crecimiento - contribuye - oportunidades | 124 | 29_ofreciendo_hecho_crecimiento_contribuye |
|
72 |
+
| 30 | asesor - reuniones - asistentes - grupo - debido | 160 | 30_asesor_reuniones_asistentes_grupo |
|
73 |
+
| 31 | flexibilidad - centr谩ndose - aspectos - emprendimientos - empresariales | 60 | 31_flexibilidad_centr谩ndose_aspectos_emprendimientos |
|
74 |
+
| 32 | tasa - baja - inter茅s - factores - desarrollo | 182 | 32_tasa_baja_inter茅s_factores |
|
75 |
+
| 33 | beneficios - discusi贸n - inversi贸n - texto - espec铆fica | 301 | 33_beneficios_discusi贸n_inversi贸n_texto |
|
76 |
+
| 34 | emprendedur铆a - beneficiosa - fomenta - all谩 - fortalecimiento | 397 | 34_emprendedur铆a_beneficiosa_fomenta_all谩 |
|
77 |
+
| 35 | asesor - relaci贸n - tasas - bajas - progreso | 106 | 35_asesor_relaci贸n_tasas_bajas |
|
78 |
+
| 36 | proporciona - confiabilidad - semanales - bajo - pagos | 151 | 36_proporciona_confiabilidad_semanales_bajo |
|
79 |
+
| 37 | crecimiento - empresarial - herramienta - impulsar - apoyan | 193 | 37_crecimiento_empresarial_herramienta_impulsar |
|
80 |
+
| 38 | miembro - banco - soluci贸n - miembros - fundaci贸n | 240 | 38_miembro_banco_soluci贸n_miembros |
|
81 |
+
| 39 | conveniencia - personales - proporcionar - res煤menes - opiniones | 92 | 39_conveniencia_personales_proporcionar_res煤menes |
|
82 |
+
| 40 | recomendaci贸n - obtener - peque帽os - requisitos - entrenamiento | 119 | 40_recomendaci贸n_obtener_peque帽os_requisitos |
|
83 |
+
| 41 | necesidad - tres - unirse - discute - grupos | 278 | 41_necesidad_tres_unirse_discute |
|
84 |
+
| 42 | continuar - significativamente - idea - inferior - mensuales | 106 | 42_continuar_significativamente_idea_inferior |
|
85 |
+
| 43 | esperanza - fondo - orador - grupo - efectiva | 84 | 43_esperanza_fondo_orador_grupo |
|
86 |
+
| 44 | alternativo - financiamiento - deuda - opci贸n - socio | 97 | 44_alternativo_financiamiento_deuda_opci贸n |
|
87 |
+
| 45 | adecuada - seriedad - consultores - opci贸n - consideraci贸n | 65 | 45_adecuada_seriedad_consultores_opci贸n |
|
88 |
+
| 46 | reuniones - l铆nea - presenciales - laborales - especialmente | 129 | 46_reuniones_l铆nea_presenciales_laborales |
|
89 |
+
| 47 | emprendedoras - femeninas - tarde - numerosos - persona | 89 | 47_emprendedoras_femeninas_tarde_numerosos |
|
90 |
+
| 48 | 煤til - fortalecer - recomendaci贸n - herramienta - principiantes | 60 | 48_煤til_fortalecer_recomendaci贸n_herramienta |
|
91 |
+
| 49 | recomendar - crecer - clientes - fecha - pr茅stamo | 163 | 49_recomendar_crecer_clientes_fecha |
|
92 |
+
| 50 | reuniones - mal - tiempo - cara - p茅rdida | 79 | 50_reuniones_mal_tiempo_cara |
|
93 |
+
| 51 | liderazgo - positivas - grupo - reunir - fondos | 70 | 51_liderazgo_positivas_grupo_reunir |
|
94 |
+
| 52 | pueden - the - discusses - for - of | 129 | 52_pueden_the_discusses_for |
|
95 |
+
| 53 | creaci贸n - ventajas - potencial - independientes - trabajadores | 91 | 53_creaci贸n_ventajas_potencial_independientes |
|
96 |
+
| 54 | contribuci贸n - organizaci贸n - compromiso - pol铆ticas - debido | 89 | 54_contribuci贸n_organizaci贸n_compromiso_pol铆ticas |
|
97 |
+
| 55 | d铆a - herramientas - pesar - institucionales - siguiente | 175 | 55_d铆a_herramientas_pesar_institucionales |
|
98 |
+
| 56 | utilidad - herramienta - texto - discute - art铆culo | 59 | 56_utilidad_herramienta_texto_discute |
|
99 |
+
| 57 | inicio - contactos - red - viable - cumple | 330 | 57_inicio_contactos_red_viable |
|
100 |
+
| 58 | propietarios - oportunidades - brindando - tradicional - peque帽as | 117 | 58_propietarios_oportunidades_brindando_tradicional |
|
101 |
+
| 59 | hacia - simplicidad - base - gratitud - expresi贸n | 151 | 59_hacia_simplicidad_base_gratitud |
|
102 |
+
| 60 | diferentes - ropa - nueva - desempe帽o - institucional | 86 | 60_diferentes_ropa_nueva_desempe帽o |
|
103 |
+
| 61 | brindada - parte - mala - caracterizada - papeleo | 51 | 61_brindada_parte_mala_caracterizada |
|
104 |
+
| 62 | descrita - experiencia - acuerdos - positiva - cumplen | 96 | 62_descrita_experiencia_acuerdos_positiva |
|
105 |
+
| 63 | tema - responsable - fomentar - salir - casa | 32 | 63_tema_responsable_fomentar_salir |
|
106 |
+
| 64 | bajos - tipos - intereses - inter茅s - fiabilidad | 63 | 64_bajos_tipos_intereses_inter茅s |
|
107 |
+
| 65 | resaltando - manera - mercanc铆as - cumplir - accesibilidad | 228 | 65_resaltando_manera_mercanc铆as_cumplir |
|
108 |
+
| 66 | transparencia - falta - dedicaci贸n - empat铆a - convertirse | 95 | 66_transparencia_falta_dedicaci贸n_empat铆a |
|
109 |
+
| 67 | pago - m茅todo - recibir - discutido - cuotas | 110 | 67_pago_m茅todo_recibir_discutido |
|
110 |
+
| 68 | considera - claras - cortos - unidad - encuentran | 169 | 68_considera_claras_cortos_unidad |
|
111 |
+
| 69 | explicaci贸n - r谩pidas - encuentro - lograr - presencia | 64 | 69_explicaci贸n_r谩pidas_encuentro_lograr |
|
112 |
+
| 70 | rendici贸n - cuentas - provisi贸n - enfatizando - conexi贸n | 86 | 70_rendici贸n_cuentas_provisi贸n_enfatizando |
|
113 |
+
| 71 | redacci贸n - discusiones - ia - usuarios - planteado | 116 | 71_redacci贸n_discusiones_ia_usuarios |
|
114 |
+
|
115 |
+
</details>
|
116 |
+
|
117 |
+
## Training hyperparameters
|
118 |
+
|
119 |
+
* calculate_probabilities: False
|
120 |
+
* language: None
|
121 |
+
* low_memory: False
|
122 |
+
* min_topic_size: 10
|
123 |
+
* n_gram_range: (1, 1)
|
124 |
+
* nr_topics: None
|
125 |
+
* seed_topic_list: None
|
126 |
+
* top_n_words: 10
|
127 |
+
* verbose: False
|
128 |
+
* zeroshot_min_similarity: 0.7
|
129 |
+
* zeroshot_topic_list: None
|
130 |
+
|
131 |
+
## Framework versions
|
132 |
+
|
133 |
+
* Numpy: 2.2.5
|
134 |
+
* HDBSCAN: 0.8.40
|
135 |
+
* UMAP: 0.5.7
|
136 |
+
* Pandas: 2.2.3
|
137 |
+
* Scikit-Learn: 1.6.1
|
138 |
+
* Sentence-transformers: 4.1.0
|
139 |
+
* Transformers: 4.51.3
|
140 |
+
* Numba: 0.61.2
|
141 |
+
* Plotly: 6.0.1
|
142 |
+
* Python: 3.12.1
|
config.json
ADDED
@@ -0,0 +1,17 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"calculate_probabilities": false,
|
3 |
+
"language": null,
|
4 |
+
"low_memory": false,
|
5 |
+
"min_topic_size": 10,
|
6 |
+
"n_gram_range": [
|
7 |
+
1,
|
8 |
+
1
|
9 |
+
],
|
10 |
+
"nr_topics": null,
|
11 |
+
"seed_topic_list": null,
|
12 |
+
"top_n_words": 10,
|
13 |
+
"verbose": false,
|
14 |
+
"zeroshot_min_similarity": 0.7,
|
15 |
+
"zeroshot_topic_list": null,
|
16 |
+
"embedding_model": "jinaai/jina-embeddings-v2-base-es"
|
17 |
+
}
|
ctfidf.safetensors
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:9215616e7378145434223ba89ddb91165b102967bb8634db4c7abb0b11272563
|
3 |
+
size 597572
|
ctfidf_config.json
ADDED
The diff for this file is too large to render.
See raw diff
|
|
topic_embeddings.safetensors
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:51ded92b829cfdb4eb6b6bf7ebb6b8af5020a7ca7f3a34a0fee387ec5bffc348
|
3 |
+
size 224344
|
topics.json
ADDED
The diff for this file is too large to render.
See raw diff
|
|