naot97 commited on
Commit
3294b87
·
verified ·
1 Parent(s): 5766cd6

Upload tokenizer

Browse files
added_tokens.json ADDED
@@ -0,0 +1,1584 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "<</SYS>>": 38366,
3
+ "<<SYS>>": 38365,
4
+ "Duyên": 38653,
5
+ "Gã": 38880,
6
+ "Gò": 38516,
7
+ "Siêu": 39468,
8
+ "Siêu▁Qu": 38444,
9
+ "Uh": 39096,
10
+ "Uy": 39882,
11
+ "[/INST]": 38368,
12
+ "[INST]": 38367,
13
+ "am▁muố": 39923,
14
+ "ang▁hồ": 39783,
15
+ "ang▁lên": 39163,
16
+ "ay▁là": 39346,
17
+ "bàn": 38581,
18
+ "chúa": 39072,
19
+ "dạo": 39637,
20
+ "ehe": 39628,
21
+ "em▁ra": 39036,
22
+ "eo▁lên": 38756,
23
+ "gò": 38901,
24
+ "gầm": 38815,
25
+ "hhh": 39569,
26
+ "hhhh": 38647,
27
+ "ihi": 39811,
28
+ "inh▁Nhị▁Cẩu": 39335,
29
+ "inh▁Trường▁Sinh": 38448,
30
+ "inh▁phục": 38524,
31
+ "iên▁cuồ": 38846,
32
+ "iên▁tiếp": 38672,
33
+ "iên▁tài": 38412,
34
+ "iên▁tục": 38457,
35
+ "iềm▁chế": 38979,
36
+ "iều▁này": 38430,
37
+ "iển▁nhiên": 38994,
38
+ "iễ": 39260,
39
+ "iễm": 39432,
40
+ "iễu": 39500,
41
+ "iện▁th": 39266,
42
+ "iện▁thoại": 38489,
43
+ "iện▁tại": 39563,
44
+ "khác▁gì": 38648,
45
+ "khúc▁khích": 38394,
46
+ "lai": 39218,
47
+ "lúc▁càng": 38433,
48
+ "lượt": 38921,
49
+ "lầu": 39735,
50
+ "mép▁lồ": 39383,
51
+ "một▁câu": 38528,
52
+ "nghĩ▁tới": 38407,
53
+ "nguồ": 39907,
54
+ "ngựa": 38824,
55
+ "nháy▁mắt": 39595,
56
+ "nhịn▁được": 39856,
57
+ "nói▁của": 38959,
58
+ "oang": 38999,
59
+ "oanh": 39516,
60
+ "oay": 38717,
61
+ "on▁cu": 39602,
62
+ "on▁cặc": 39107,
63
+ "oà": 38415,
64
+ "oàng": 38529,
65
+ "oàn▁bộ": 38592,
66
+ "oàn▁thân": 39883,
67
+ "oàn▁toà": 39764,
68
+ "oá": 38680,
69
+ "oái": 38796,
70
+ "oát": 39473,
71
+ "oáy": 39245,
72
+ "oã": 39590,
73
+ "oạ": 38741,
74
+ "oạt": 38677,
75
+ "oả": 38553,
76
+ "oải▁mái": 39081,
77
+ "oặc": 38710,
78
+ "phú": 38496,
79
+ "phải▁là": 39929,
80
+ "thiệu": 38786,
81
+ "trần": 38376,
82
+ "tỏa": 38837,
83
+ "ui▁vẻ": 39629,
84
+ "ung▁quanh": 38976,
85
+ "ung▁sướ": 39262,
86
+ "ung▁sướng": 38895,
87
+ "uya": 39692,
88
+ "uyế": 38567,
89
+ "uyề": 38539,
90
+ "uyể": 38651,
91
+ "uyễ": 39587,
92
+ "uyện▁gì": 38740,
93
+ "uyện▁này": 39450,
94
+ "uy▁hiểm": 39176,
95
+ "uy▁nghĩ": 39486,
96
+ "uy▁nhất": 38932,
97
+ "uô": 38383,
98
+ "uông": 39593,
99
+ "uôn▁mặt": 39682,
100
+ "uýt": 38634,
101
+ "uấ": 39644,
102
+ "uật": 38760,
103
+ "uệ": 38428,
104
+ "uối▁cù": 39617,
105
+ "uối▁cùng": 39010,
106
+ "uồ": 38893,
107
+ "uồi": 38621,
108
+ "uổ": 39510,
109
+ "uộ": 39419,
110
+ "xuôi": 38814,
111
+ "xóm": 39382,
112
+ "Ánh▁mắt": 39833,
113
+ "ài▁Gò": 39233,
114
+ "àng▁hoàng": 39202,
115
+ "àn▁bà": 39043,
116
+ "àn▁nhà": 38956,
117
+ "àn▁ông": 39915,
118
+ "ái▁tim": 39235,
119
+ "ái▁tóc": 39723,
120
+ "ái▁xe": 39401,
121
+ "ám▁người": 39836,
122
+ "ám▁đốc": 38514,
123
+ "áng▁người": 39350,
124
+ "áy▁mắt": 39713,
125
+ "ân▁cũng": 39165,
126
+ "ân▁của": 39818,
127
+ "ân▁mê": 38930,
128
+ "ân▁đã": 38547,
129
+ "âu▁yếm": 39885,
130
+ "ây▁giờ": 38844,
131
+ "ây▁là": 39313,
132
+ "ãnh▁liệt": 39769,
133
+ "ình▁như": 39482,
134
+ "ình▁th": 39240,
135
+ "ìu": 38812,
136
+ "ính▁là": 39829,
137
+ "íu▁mày": 39037,
138
+ "óe": 39205,
139
+ "ón▁tay": 39857,
140
+ "ôi▁môi": 38395,
141
+ "ôi▁mắt": 38733,
142
+ "ôi▁qua": 39674,
143
+ "ôm▁nay": 39651,
144
+ "ôm▁qua": 39087,
145
+ "ông▁ti": 39935,
146
+ "ông▁ty": 38929,
147
+ "ông▁tác": 39467,
148
+ "ông▁tử": 39779,
149
+ "õa": 39372,
150
+ "ùng▁mình": 39788,
151
+ "úc▁này": 38526,
152
+ "úi▁xuố": 38401,
153
+ "úi▁đầu": 39386,
154
+ "úm▁vú": 38821,
155
+ "úng▁là": 39412,
156
+ "úng▁vậy": 39400,
157
+ "ĩu": 39688,
158
+ "ĩu▁môi": 38819,
159
+ "ơn▁giả": 39279,
160
+ "ơn▁nữa": 39525,
161
+ "ưng▁phấ": 38857,
162
+ "ương▁cũng": 38754,
163
+ "ương▁của": 38405,
164
+ "ương▁cứ": 38692,
165
+ "ương▁mặt": 38879,
166
+ "ương▁nh": 39091,
167
+ "ương▁nhiên": 39374,
168
+ "ương▁vật": 39108,
169
+ "ướm": 38474,
170
+ "ướng▁Nhật": 39001,
171
+ "ường▁Sinh": 38388,
172
+ "ường▁giả": 39700,
173
+ "ường▁như": 39065,
174
+ "ưởng▁th": 38636,
175
+ "ưởng▁thụ": 39254,
176
+ "ưởng▁thức": 39870,
177
+ "ượng▁ng": 39394,
178
+ "ạc▁Nam": 38575,
179
+ "ạc▁nhiên": 38949,
180
+ "ại▁sao": 39607,
181
+ "ạnh▁phúc": 39141,
182
+ "ạn▁đang▁đọc▁truyện": 39461,
183
+ "ạo▁này": 38548,
184
+ "ạo▁rực": 39659,
185
+ "ạy▁cảm": 39749,
186
+ "ải▁mái": 38854,
187
+ "ải▁qua": 39441,
188
+ "ảm▁giác": 38858,
189
+ "ảnh▁khắc": 39149,
190
+ "ảy▁ra": 39571,
191
+ "ấn▁công": 39184,
192
+ "ấn▁đề": 39766,
193
+ "ấn▁độ": 39910,
194
+ "ấp▁nhậ": 39754,
195
+ "ất▁cả": 39291,
196
+ "ất▁nhiên": 38451,
197
+ "ất▁quá": 39780,
198
+ "ất▁vả": 39630,
199
+ "ẦM": 38396,
200
+ "ầm▁chậm": 39696,
201
+ "ầm▁lấy": 39442,
202
+ "ần▁có": 38523,
203
+ "ần▁của": 38864,
204
+ "ần▁này": 39152,
205
+ "ần▁tr": 39369,
206
+ "ần▁truồ": 39362,
207
+ "ần▁đầu": 39018,
208
+ "ần▁đầu▁tiên": 39491,
209
+ "ầu▁vú": 39136,
210
+ "ẩm▁bẩm": 38859,
211
+ "ẩm▁ướt": 38509,
212
+ "ẩn▁bị": 39890,
213
+ "ẩn▁th": 38587,
214
+ "ẩn▁thậ": 39371,
215
+ "ậm▁chí": 39770,
216
+ "ập▁tức": 39067,
217
+ "ật▁đầu": 39693,
218
+ "ắc▁mắc": 39665,
219
+ "��t▁đầu": 38834,
220
+ "ằm▁chằm": 38845,
221
+ "ẳng▁lẽ": 39007,
222
+ "ẳng▁định": 38963,
223
+ "ặc▁biệt": 38578,
224
+ "ặc▁dù": 38479,
225
+ "ến▁rũ": 38839,
226
+ "ệch": 38565,
227
+ "ỉm": 39208,
228
+ "ỉm▁cười": 38385,
229
+ "ỉnh▁thoả": 38583,
230
+ "ịu": 39773,
231
+ "ọc▁tr": 39817,
232
+ "ọc▁truyện": 39289,
233
+ "ọi▁người": 38842,
234
+ "ọi▁thứ": 39732,
235
+ "ọn▁họ": 39138,
236
+ "ỏa▁mã": 39457,
237
+ "ốc▁độ": 39919,
238
+ "ối▁hậ": 39545,
239
+ "ối▁hợp": 39155,
240
+ "ối▁rối": 38379,
241
+ "ối▁với": 39673,
242
+ "ống▁Thanh": 39132,
243
+ "ống▁Thanh▁Thư": 38441,
244
+ "ống▁ch": 39904,
245
+ "ống▁chế": 39053,
246
+ "ống▁như": 39720,
247
+ "ốt▁cuộc": 38398,
248
+ "ồn▁tại": 38459,
249
+ "ổm": 39460,
250
+ "ổng▁mông": 39317,
251
+ "ội▁vàng": 39646,
252
+ "ội▁vã": 39476,
253
+ "ộng▁ra": 39778,
254
+ "ột▁le": 38778,
255
+ "ột▁nhiên": 38387,
256
+ "ời▁gia": 38813,
257
+ "ởi▁vì": 38632,
258
+ "ụm": 38958,
259
+ "Ủa": 39730,
260
+ "ứng▁kiế": 39655,
261
+ "ừng▁có": 39623,
262
+ "ừng▁lại": 39389,
263
+ "ựa▁chọ": 39526,
264
+ "ựa▁vào": 39402,
265
+ "ực▁kỳ": 38763,
266
+ "ực▁tiếp": 39277,
267
+ "▁Chiế": 39559,
268
+ "▁Chí▁Tô": 39898,
269
+ "▁Chủ▁tịch": 38582,
270
+ "▁Cò": 38726,
271
+ "▁Cẩu": 38633,
272
+ "▁Diệp▁Mặc": 38458,
273
+ "▁Dì": 39395,
274
+ "▁Hiề": 38840,
275
+ "▁Huyề": 38878,
276
+ "▁Hù": 39035,
277
+ "▁Hư": 39494,
278
+ "▁Hắ": 39257,
279
+ "▁Hằ": 39484,
280
+ "▁Hừ": 39114,
281
+ "▁Kiế": 39554,
282
+ "▁Kỵ": 39928,
283
+ "▁Lãnh▁Nghệ": 39714,
284
+ "▁Lúc▁này": 38601,
285
+ "▁Lý▁Hà": 39304,
286
+ "▁Lăng▁Phong": 39119,
287
+ "▁Lương▁Thần": 39613,
288
+ "▁Lạc▁Nam": 39933,
289
+ "▁Mày": 39427,
290
+ "▁Nghệ▁Phong": 39095,
291
+ "▁Nhì": 38606,
292
+ "▁Nhị▁Cẩu": 39739,
293
+ "▁Nhữ": 39002,
294
+ "▁Nói▁xong": 39134,
295
+ "▁Phượ": 38673,
296
+ "▁Quyể": 39531,
297
+ "▁Thuyề": 39542,
298
+ "▁Tiế": 39296,
299
+ "▁Tiểu▁Mai": 39220,
300
+ "▁Tiểu▁Đình": 39397,
301
+ "▁Trường▁Sinh": 38988,
302
+ "▁Tuyề": 38900,
303
+ "▁Tuấ": 38798,
304
+ "▁Tù": 38998,
305
+ "▁Tống▁Thanh▁Thư": 38465,
306
+ "▁Tộc": 38645,
307
+ "▁Uyể": 38650,
308
+ "▁Vâ": 38876,
309
+ "▁Vă": 39201,
310
+ "▁Vương▁Trường▁Sinh": 38720,
311
+ "▁Vậ": 38927,
312
+ "▁Yế": 39560,
313
+ "▁ai▁cũng": 38874,
314
+ "▁anh▁có": 39089,
315
+ "▁anh▁em": 39553,
316
+ "▁anh▁ta": 39515,
317
+ "▁anh▁ấy": 39759,
318
+ "▁an▁toà": 39429,
319
+ "▁bao▁giờ": 39080,
320
+ "▁bao▁lâu": 39581,
321
+ "▁bao▁nhiêu": 39709,
322
+ "▁ba▁người": 39166,
323
+ "▁biế": 39101,
324
+ "▁biến▁mất": 39620,
325
+ "▁biết▁là": 38850,
326
+ "▁biết▁được": 39789,
327
+ "▁biể": 39393,
328
+ "▁buồ": 39787,
329
+ "▁buồi": 39846,
330
+ "▁bàn▁tay": 39908,
331
+ "▁bà▁ta": 38888,
332
+ "▁bác▁sĩ": 39271,
333
+ "▁bây▁giờ": 38550,
334
+ "▁bên▁cạnh": 39227,
335
+ "▁bên▁dưới": 38391,
336
+ "▁bên▁kia": 39074,
337
+ "▁bên▁ngoài": 38835,
338
+ "▁bên▁trong": 39439,
339
+ "▁bình▁th": 38551,
340
+ "▁bình▁thườ": 39619,
341
+ "▁bình▁tĩnh": 39058,
342
+ "▁bí▁mật": 39157,
343
+ "▁bí▁thư": 38833,
344
+ "▁bóp▁vú": 38608,
345
+ "▁bă": 38805,
346
+ "▁bước▁vào": 38843,
347
+ "▁bạn▁gái": 39099,
348
+ "▁bản▁nă": 38991,
349
+ "▁bản▁thân": 39086,
350
+ "▁bảo▁vệ": 39232,
351
+ "▁bất▁cứ": 39899,
352
+ "▁bất▁kỳ": 38502,
353
+ "▁bất▁ngờ": 39906,
354
+ "▁bầu▁vú": 39871,
355
+ "▁bậ": 38605,
356
+ "▁bắ": 38420,
357
+ "▁bắt▁đầu": 39755,
358
+ "▁bằ": 39790,
359
+ "▁bọn▁chú": 38905,
360
+ "▁bọn▁hắ": 39147,
361
+ "▁bọn▁họ": 39529,
362
+ "▁bố▁mẹ": 38811,
363
+ "▁bỗ": 38545,
364
+ "▁bộ▁ngực": 38424,
365
+ "▁bộ▁đồ": 38749,
366
+ "▁bởi▁vì": 38504,
367
+ "▁bụ": 38788,
368
+ "▁bừ": 39522,
369
+ "▁chiếc▁xe": 39594,
370
+ "▁chiếc▁áo": 38906,
371
+ "▁chiến▁đấu": 39874,
372
+ "▁cho▁anh": 39654,
373
+ "▁cho▁chị": 39786,
374
+ "▁cho▁con": 38747,
375
+ "▁cho▁cô": 38769,
376
+ "▁cho▁dù": 39189,
377
+ "▁cho▁em": 39576,
378
+ "▁cho▁hắ": 39892,
379
+ "▁cho▁mình": 39860,
380
+ "▁cho▁mẹ": 38934,
381
+ "▁cho▁nàng": 39750,
382
+ "▁cho▁nên": 39762,
383
+ "▁cho▁nó": 38607,
384
+ "▁cho▁tôi": 38422,
385
+ "▁chui▁vào": 38735,
386
+ "▁chuyế": 38992,
387
+ "▁chuyể": 39854,
388
+ "▁chuyệ": 39681,
389
+ "▁chuyện▁của": 39588,
390
+ "▁chuyện▁gì": 39175,
391
+ "▁chuyện▁này": 38372,
392
+ "▁chuyện▁đó": 38897,
393
+ "▁chuẩn▁bị": 38580,
394
+ "▁chá": 39676,
395
+ "▁ché": 38686,
396
+ "▁chính▁là": 39195,
397
+ "▁chính▁mình": 39925,
398
+ "▁chúng▁nó": 38772,
399
+ "▁chúng▁ta": 39478,
400
+ "▁chúng▁tôi": 38532,
401
+ "▁chút▁nào": 39760,
402
+ "▁chút▁nữa": 39075,
403
+ "▁chă": 39579,
404
+ "▁chăm▁sóc": 39323,
405
+ "▁chưa▁bao▁giờ": 38419,
406
+ "▁chưa▁từ": 39603,
407
+ "▁chạm▁vào": 38609,
408
+ "▁chảy▁ra": 39281,
409
+ "▁chấp▁nhậ": 38804,
410
+ "▁chầm▁chậm": 38722,
411
+ "▁chậm▁rãi": 39499,
412
+ "▁chắ": 38862,
413
+ "▁chắc▁chắ": 39168,
414
+ "▁chắc▁là": 39794,
415
+ "▁chẳ": 38558,
416
+ "▁chẳng▁có": 39685,
417
+ "▁chặt▁lấy": 38508,
418
+ "▁chỉ▁biết": 38699,
419
+ "▁chỉ▁cò": 38369,
420
+ "▁chỉ▁có": 38946,
421
+ "▁chỉ▁có▁thể": 39366,
422
+ "▁chỉ▁cần": 38564,
423
+ "▁chỉ▁là": 39679,
424
+ "▁chỉ▁muố": 39310,
425
+ "▁chịu▁được": 38931,
426
+ "▁chịu▁đự": 38817,
427
+ "▁chị▁em": 38406,
428
+ "▁chọ": 38800,
429
+ "▁chố": 38619,
430
+ "▁chồ": 39239,
431
+ "▁chỗ▁nào": 38806,
432
+ "▁chờ▁đợi": 38475,
433
+ "▁chụt": 38386,
434
+ "▁chủ▁tịch": 39647,
435
+ "▁chủ▁độ": 38783,
436
+ "▁chứng▁kiế": 39237,
437
+ "▁coi▁như": 39378,
438
+ "▁con▁bé": 38980,
439
+ "▁con▁ch": 39564,
440
+ "▁con▁chó": 39241,
441
+ "▁con▁cu": 38730,
442
+ "▁con▁cặc": 38764,
443
+ "▁con▁cặc▁của▁tôi": 39540,
444
+ "▁con▁dâu": 39519,
445
+ "▁con▁gái": 38909,
446
+ "▁con▁người": 38615,
447
+ "▁con▁nhỏ": 39573,
448
+ "▁con▁trai": 39299,
449
+ "▁cuố": 39214,
450
+ "▁cuối▁cù": 39390,
451
+ "▁cuối▁cùng": 39110,
452
+ "▁cuồ": 39416,
453
+ "▁cuộc▁số": 38470,
454
+ "▁cuộc▁đời": 38987,
455
+ "▁càng▁lúc▁càng": 38688,
456
+ "▁càng▁thêm": 39318,
457
+ "▁các▁bạ": 38968,
458
+ "▁các▁ngươi": 39832,
459
+ "▁các▁nàng": 39193,
460
+ "▁cái▁cảm▁giác": 39234,
461
+ "▁cái▁gì": 38566,
462
+ "▁cái▁khe": 39224,
463
+ "▁cái▁lồ": 39541,
464
+ "▁cái▁lỗ": 39616,
465
+ "▁cái▁mu": 39226,
466
+ "▁cái▁mông": 38635,
467
+ "▁cái▁này": 38793,
468
+ "▁cái▁quần": 39806,
469
+ "▁cái▁áo": 38838,
470
+ "▁cái▁đầu": 39556,
471
+ "▁cánh▁cửa": 38962,
472
+ "▁cánh▁tay": 38702,
473
+ "▁câu▁nói": 39753,
474
+ "▁còn▁chưa": 39428,
475
+ "▁còn▁có": 39795,
476
+ "▁còn▁gì": 39597,
477
+ "▁còn▁không": 38586,
478
+ "▁còn▁lại": 39243,
479
+ "▁có▁ai": 39703,
480
+ "▁có▁biết": 39721,
481
+ "▁có▁chuyện▁gì": 38687,
482
+ "▁có▁chút": 39678,
483
+ "▁có▁cảm▁giác": 38773,
484
+ "▁có▁gì": 38808,
485
+ "▁có▁lẽ": 38538,
486
+ "▁có▁một": 39748,
487
+ "▁có▁người": 38748,
488
+ "▁có▁nhiều": 39520,
489
+ "▁có▁phải": 39851,
490
+ "▁có▁thể": 38431,
491
+ "▁có▁vẻ": 39284,
492
+ "▁có▁được": 38620,
493
+ "▁công▁ty": 39455,
494
+ "▁công▁tử": 38789,
495
+ "▁công▁việc": 38718,
496
+ "▁côn▁thịt": 38627,
497
+ "▁cô▁bé": 39379,
498
+ "▁cô▁giáo": 39863,
499
+ "▁cô▁gái": 38646,
500
+ "▁cô▁nàng": 38872,
501
+ "▁cô▁ta": 39135,
502
+ "▁cô▁đã": 39823,
503
+ "▁cô▁ấy": 38759,
504
+ "▁cùng▁một": 39689,
505
+ "▁cùng▁nhau": 38552,
506
+ "▁cùng▁với": 39104,
507
+ "▁cúi▁xuố": 39878,
508
+ "▁cúi▁đầu": 39015,
509
+ "▁căng▁trò": 38871,
510
+ "▁căn▁nhà": 39583,
511
+ "▁căn▁phò": 39664,
512
+ "▁cũng▁biết": 39407,
513
+ "▁cũng▁bị": 39849,
514
+ "▁cũng▁chưa": 38494,
515
+ "▁cũng▁chẳ": 39265,
516
+ "▁cũng▁chỉ": 39687,
517
+ "▁cũng▁có": 38863,
518
+ "▁cũng▁có▁thể": 39496,
519
+ "▁cũng▁không": 38513,
520
+ "▁cũng▁không▁biết": 39876,
521
+ "▁cũng▁không▁có": 39013,
522
+ "▁cũng▁không▁thể": 38579,
523
+ "▁cũng▁là": 38972,
524
+ "▁cũng▁muố": 38571,
525
+ "▁cũng▁như": 39380,
526
+ "▁cũng▁phải": 39936,
527
+ "▁cũng▁rất": 39342,
528
+ "▁cũng▁sẽ": 38701,
529
+ "▁cũng▁vậy": 38709,
530
+ "▁cũng▁đang": 38940,
531
+ "▁cũng▁đã": 39656,
532
+ "▁cũng▁được": 38629,
533
+ "▁cơ▁chứ": 38887,
534
+ "▁cơ▁hội": 38568,
535
+ "▁cơ▁mà": 39046,
536
+ "▁cơ▁thể": 38531,
537
+ "▁cương▁cứ": 39507,
538
+ "▁cười▁cười": 39435,
539
+ "▁cường▁giả": 39215,
540
+ "▁cưỡ": 38684,
541
+ "▁cạ": 38517,
542
+ "▁cảm▁giác": 38625,
543
+ "▁cảm▁nhậ": 39031,
544
+ "▁cảm▁nhận▁được": 39364,
545
+ "▁cảm▁thấy": 39453,
546
+ "▁cảm▁xúc": 38799,
547
+ "▁cảnh▁sát": 39352,
548
+ "▁cả▁hai": 38728,
549
+ "▁cả▁người": 39252,
550
+ "▁cẩn▁thậ": 39092,
551
+ "▁cậ": 38791,
552
+ "▁cậu▁ta": 39073,
553
+ "▁cắ": 38775,
554
+ "▁cặc": 38559,
555
+ "▁cặp▁mông": 39614,
556
+ "▁cặp▁vú": 38644,
557
+ "▁cố▁gắ": 38707,
558
+ "▁của▁anh": 38421,
559
+ "▁của▁ba": 38427,
560
+ "▁của▁bà": 38935,
561
+ "▁của▁chị": 38948,
562
+ "▁của▁con": 38655,
563
+ "▁của▁cô": 39016,
564
+ "▁của▁em": 38527,
565
+ "▁của▁gã": 38610,
566
+ "▁của▁hai": 39368,
567
+ "▁của▁hắ": 39793,
568
+ "▁của▁lão": 38784,
569
+ "▁của▁mình": 38478,
570
+ "▁của▁mẹ": 39489,
571
+ "▁của▁một": 39146,
572
+ "▁của▁người": 39280,
573
+ "▁của▁nàng": 39744,
574
+ "▁của▁nó": 39054,
575
+ "▁của▁ta": 38468,
576
+ "▁của▁thằng": 38830,
577
+ "▁của▁tôi": 38907,
578
+ "▁của▁ông": 39827,
579
+ "▁cứng▁ngắc": 39702,
580
+ "▁cứ▁thế": 38884,
581
+ "▁cửa▁sổ": 39631,
582
+ "▁cực▁kỳ": 38711,
583
+ "▁da▁thịt": 38780,
584
+ "▁diễ": 38922,
585
+ "▁diễm": 38738,
586
+ "▁diễn▁ra": 38642,
587
+ "▁diệ": 38792,
588
+ "▁di▁chuyể": 39939,
589
+ "▁duy▁nhất": 39253,
590
+ "▁dá": 39911,
591
+ "▁dâ": 38926,
592
+ "▁dâm▁thủy": 38977,
593
+ "▁dâm▁đã": 39618,
594
+ "▁dù▁sao": 39881,
595
+ "▁dương▁vật": 38996,
596
+ "▁dường▁như": 39244,
597
+ "▁dần▁dần": 39667,
598
+ "▁dẫ": 38794,
599
+ "▁dặ": 39916,
600
+ "▁dễ▁dàng": 39068,
601
+ "▁dọ": 38569,
602
+ "▁dọc▁theo": 39584,
603
+ "▁dồ": 38695,
604
+ "▁dừng▁lại": 39044,
605
+ "▁dựa▁vào": 39020,
606
+ "▁em▁có": 39549,
607
+ "▁em▁cũng": 38734,
608
+ "▁em▁gái": 39843,
609
+ "▁em▁lại": 39483,
610
+ "▁em▁nó": 39627,
611
+ "▁em▁sẽ": 39797,
612
+ "▁em▁đi": 38499,
613
+ "▁em▁đã": 39231,
614
+ "▁ghì": 38402,
615
+ "▁gia▁đình": 39223,
616
+ "▁giườ": 39671,
617
+ "▁giải▁quyết": 38399,
618
+ "▁giải▁thích": 39121,
619
+ "▁giả▁vờ": 39375,
620
+ "▁giấc▁ngủ": 39653,
621
+ "▁giậ": 39261,
622
+ "▁giật▁mình": 39197,
623
+ "▁giọ": 38917,
624
+ "▁giọng▁nói": 38416,
625
+ "▁giố": 38374,
626
+ "▁giống▁như": 38903,
627
+ "▁giới▁thiệu": 39200,
628
+ "▁giờ▁đây": 38534,
629
+ "▁giữa▁hai": 39917,
630
+ "▁gáp": 39327,
631
+ "▁gì▁cả": 38604,
632
+ "▁gì▁mà": 39725,
633
+ "▁gì▁nữa": 39344,
634
+ "▁gì▁thì": 39093,
635
+ "▁gì▁đâu": 39694,
636
+ "▁gì▁đó": 39083,
637
+ "▁gù": 39567,
638
+ "▁gương▁mặt": 39448,
639
+ "▁gần▁như": 39391,
640
+ "▁gật▁đầu": 38997,
641
+ "▁gắ": 39848,
642
+ "▁gọ": 39298,
643
+ "▁gọi▁cho": 39012,
644
+ "▁gọi▁là": 39319,
645
+ "▁gợ": 39501,
646
+ "▁hai▁bên": 38777,
647
+ "▁hai▁bầu▁vú": 39424,
648
+ "▁hai▁ch": 38807,
649
+ "▁hai▁chân": 38671,
650
+ "▁hai▁cái": 39717,
651
+ "▁hai▁mắt": 38954,
652
+ "▁hai▁người": 39403,
653
+ "▁hai▁tay": 38397,
654
+ "▁hai▁đứa": 39430,
655
+ "▁ham▁muố": 38919,
656
+ "▁hay▁không": 38881,
657
+ "▁hay▁là": 39601,
658
+ "▁hiề": 38533,
659
+ "▁hiệ": 38706,
660
+ "▁hiện▁lên": 38462,
661
+ "▁hiện▁ra": 39538,
662
+ "▁hiện▁tại": 39845,
663
+ "▁hoàn▁toà": 39835,
664
+ "▁hoả": 38865,
665
+ "▁huố": 38712,
666
+ "▁hy▁vọ": 39731,
667
+ "▁hành▁độ": 39582,
668
+ "▁hì": 38970,
669
+ "▁hình▁như": 39034,
670
+ "▁hình▁ảnh": 38947,
671
+ "▁hí": 38598,
672
+ "▁hôm▁nay": 38519,
673
+ "▁hôm▁qua": 39361,
674
+ "▁hôm▁đó": 38933,
675
+ "▁hôn▁lên": 38585,
676
+ "▁hù": 39295,
677
+ "▁hơi▁thở": 39774,
678
+ "▁hơn▁nữa": 39137,
679
+ "▁hưng▁phấ": 39761,
680
+ "▁hướ": 39194,
681
+ "▁hưở": 39668,
682
+ "▁hưởng▁thụ": 38471,
683
+ "▁hạnh▁phúc": 38920,
684
+ "▁hấp▁dẫ": 39661,
685
+ "▁hẩy": 39708,
686
+ "▁hậ": 38576,
687
+ "▁hắ": 38765,
688
+ "▁hắn▁cũng": 38693,
689
+ "▁hắn▁không": 39711,
690
+ "▁hắn▁đã": 38984,
691
+ "▁hẳ": 39238,
692
+ "▁hẹ": 39267,
693
+ "▁hết▁cả": 38894,
694
+ "▁hết▁sức": 38434,
695
+ "▁học▁sinh": 38510,
696
+ "▁hỏ": 38447,
697
+ "▁hổn▁hể": 39855,
698
+ "▁hột▁le": 39071,
699
+ "▁hứ": 39236,
700
+ "▁hứng▁thú": 38554,
701
+ "▁hừ": 39698,
702
+ "▁hử": 38649,
703
+ "▁im▁lặ": 38507,
704
+ "▁khiế": 39562,
705
+ "▁khiến▁cho": 38511,
706
+ "▁khiến▁nàng": 39312,
707
+ "▁khiến▁tôi": 39652,
708
+ "▁khi▁nào": 39942,
709
+ "▁khi▁thấy": 39246,
710
+ "▁khi▁tôi": 39550,
711
+ "▁khoái▁cảm": 38446,
712
+ "▁khoả": 38831,
713
+ "▁khuôn▁mặt": 39701,
714
+ "▁khà": 38683,
715
+ "▁khách▁sạ": 38485,
716
+ "▁khó▁chịu": 38690,
717
+ "▁khó▁khă": 39384,
718
+ "▁không▁ai": 39741,
719
+ "▁không▁bao▁giờ": 39359,
720
+ "▁không▁biết": 38484,
721
+ "▁không▁ch": 38515,
722
+ "▁không▁cho": 39357,
723
+ "▁không▁chịu": 38852,
724
+ "▁không▁cò": 38491,
725
+ "▁không▁có": 39527,
726
+ "▁không▁có▁gì": 39314,
727
+ "▁không▁cần": 38827,
728
+ "▁không▁dám": 39802,
729
+ "▁không▁gia": 39853,
730
+ "▁không▁hiểu": 39111,
731
+ "▁không▁hề": 39415,
732
+ "▁không▁khí": 39084,
733
+ "▁không▁khỏi": 38600,
734
+ "▁không▁làm": 38476,
735
+ "▁không▁muố": 39920,
736
+ "▁không▁ng": 39219,
737
+ "▁không▁ngờ": 38914,
738
+ "▁không▁ngừ": 39785,
739
+ "▁không▁nói": 38724,
740
+ "▁không▁nói▁gì": 39199,
741
+ "▁không▁nổi": 38628,
742
+ "▁không▁phải": 38437,
743
+ "▁không▁phải▁là": 38823,
744
+ "▁không▁sao": 39909,
745
+ "▁không▁th": 38520,
746
+ "▁không▁thì": 38989,
747
+ "▁không▁thích": 39315,
748
+ "▁không▁thấy": 39377,
749
+ "▁không▁thể": 39440,
750
+ "▁không▁thể▁nào": 39003,
751
+ "▁không▁ti": 39161,
752
+ "▁không▁ít": 39088,
753
+ "▁không▁được": 39521,
754
+ "▁không▁để": 39608,
755
+ "▁khă": 39533,
756
+ "▁khả▁nă": 38704,
757
+ "▁khấc": 39930,
758
+ "▁khẳng▁định": 38549,
759
+ "▁khố": 38752,
760
+ "▁khổng▁lồ": 39903,
761
+ "▁khủ": 39873,
762
+ "▁kinh▁khủ": 39333,
763
+ "▁kinh▁nghiệm": 38912,
764
+ "▁kinh▁ngạc": 38418,
765
+ "▁kiế": 39437,
766
+ "▁kiểm▁tra": 38908,
767
+ "▁kiệ": 39840,
768
+ "▁kéo▁dài": 38577,
769
+ "▁kìa": 38449,
770
+ "▁kích▁thích": 39941,
771
+ "▁kết▁quả": 38975,
772
+ "▁kết▁thúc": 39274,
773
+ "▁kế▁hoạch": 39492,
774
+ "▁kỳ▁lạ": 39831,
775
+ "▁liên▁hồi": 39406,
776
+ "▁liên▁qua": 39160,
777
+ "▁liên▁tục": 39585,
778
+ "▁liếm": 39572,
779
+ "▁liề": 38708,
780
+ "▁loạ": 38779,
781
+ "▁lo▁lắ": 38866,
782
+ "▁luyệ": 39634,
783
+ "▁luô": 39204,
784
+ "▁luậ": 39142,
785
+ "▁luồ": 39517,
786
+ "▁làm▁cho": 39360,
787
+ "▁làm▁em": 39367,
788
+ "▁làm▁gì": 38657,
789
+ "▁làm▁sao": 38660,
790
+ "▁làm▁tình": 38990,
791
+ "▁làm▁tôi": 39838,
792
+ "▁làm▁việc": 39140,
793
+ "▁làm▁được": 39528,
794
+ "▁là▁ai": 39454,
795
+ "▁là▁anh": 39641,
796
+ "▁là▁có": 38923,
797
+ "▁là▁do": 39258,
798
+ "▁là▁em": 39303,
799
+ "▁là▁gì": 38450,
800
+ "▁là▁một": 39463,
801
+ "▁là▁người": 38746,
802
+ "▁là▁tôi": 39943,
803
+ "▁là▁được": 39577,
804
+ "▁láp": 38952,
805
+ "▁lâu▁rồi": 39354,
806
+ "▁lãnh▁đạo": 38543,
807
+ "▁lão▁già": 38953,
808
+ "▁lé": 39490,
809
+ "▁lên▁cái": 39599,
810
+ "▁lên▁một": 38593,
811
+ "▁lên▁người": 39465,
812
+ "▁lên▁rồi": 39047,
813
+ "▁lên▁tiế": 39115,
814
+ "▁lên▁trên": 39023,
815
+ "▁lên▁đỉnh": 39009,
816
+ "▁lù": 39758,
817
+ "▁lúc▁nào": 39775,
818
+ "▁lúc▁này": 38556,
819
+ "▁lúc▁nãy": 39443,
820
+ "▁lúc▁sau": 38978,
821
+ "▁lúc▁đó": 39862,
822
+ "▁lút": 39645,
823
+ "▁lý▁do": 39566,
824
+ "▁lă": 39345,
825
+ "▁lưỡ": 38461,
826
+ "▁lưỡi▁của": 38685,
827
+ "▁lưỡi▁liếm": 38810,
828
+ "▁lượ": 38941,
829
+ "▁lại▁bị": 38426,
830
+ "▁lại▁cho": 38540,
831
+ "▁lại▁càng": 38481,
832
+ "▁lại▁cò": 39405,
833
+ "▁lại▁có": 39118,
834
+ "▁lại▁gần": 39027,
835
+ "▁lại▁không": 39574,
836
+ "▁lại▁là": 38981,
837
+ "▁lại▁một": 38915,
838
+ "▁lại▁được": 39196,
839
+ "▁lấy▁cái": 38755,
840
+ "▁lấy▁tay": 39867,
841
+ "▁lần▁này": 39029,
842
+ "▁lần▁nữa": 38436,
843
+ "▁lần▁trước": 39082,
844
+ "▁lần▁đầu": 39724,
845
+ "▁lần▁đầu▁tiên": 38463,
846
+ "▁lẫ": 39756,
847
+ "▁lập▁tức": 39808,
848
+ "▁lắ": 39264,
849
+ "▁lắc▁đầu": 38624,
850
+ "▁lắm▁rồi": 38822,
851
+ "▁lặ": 38889,
852
+ "▁lỏ": 39570,
853
+ "▁lồn▁chị": 39474,
854
+ "▁lồn▁của": 38868,
855
+ "▁lồn▁em": 38572,
856
+ "▁lồn▁mẹ": 39535,
857
+ "▁lồn▁nàng": 38390,
858
+ "▁lỗ▁lồ": 39752,
859
+ "▁lỗ▁đít": 39680,
860
+ "▁lộ▁ra": 39063,
861
+ "▁lợ": 38403,
862
+ "▁lực▁lượ": 39217,
863
+ "▁mang▁theo": 38417,
864
+ "▁may▁mắ": 39946,
865
+ "▁miế": 39179,
866
+ "▁miễ": 38721,
867
+ "▁miệ": 38393,
868
+ "▁muố": 39844,
869
+ "▁muốn▁ch": 39112,
870
+ "▁muốn▁làm": 38501,
871
+ "▁muộ": 39462,
872
+ "▁màu▁trắ": 38801,
873
+ "▁màu▁đe": 38829,
874
+ "▁mà▁anh": 38659,
875
+ "▁mà▁cò": 39216,
876
+ "▁mà▁em": 38925,
877
+ "▁mà▁không": 38960,
878
+ "▁mà▁nó": 38498,
879
+ "▁mà▁thôi": 38916,
880
+ "▁mà▁tôi": 38656,
881
+ "▁mái▁tóc": 39451,
882
+ "▁mãnh▁liệt": 39891,
883
+ "▁mình▁đang": 38950,
884
+ "▁mình▁đã": 39524,
885
+ "▁mó": 39445,
886
+ "▁mượ": 38902,
887
+ "▁mạnh▁hơ": 39901,
888
+ "▁mạnh▁mẽ": 39292,
889
+ "▁mạnh▁vào": 38727,
890
+ "▁mấy▁cái": 39085,
891
+ "▁mấy▁ngày": 39511,
892
+ "▁mấy▁người": 38454,
893
+ "▁mấy▁đứa": 39250,
894
+ "▁mắ": 39025,
895
+ "▁mắt▁nhì": 39158,
896
+ "▁mặc▁dù": 38409,
897
+ "▁mặt▁vào": 39781,
898
+ "▁mẹ▁con": 38472,
899
+ "▁mẹ▁nó": 39824,
900
+ "▁mẹ▁tôi": 39122,
901
+ "▁mềm▁mại": 39049,
902
+ "▁mệt▁mỏi": 38616,
903
+ "▁mỉm▁cười": 39188,
904
+ "▁mọ": 39338,
905
+ "▁mọi▁chuyệ": 38892,
906
+ "▁mọi▁người": 39051,
907
+ "▁mọi▁thứ": 38703,
908
+ "▁mồ▁hôi": 38995,
909
+ "▁mỗ": 39471,
910
+ "▁mỗi▁lần": 38518,
911
+ "▁một▁bên": 39307,
912
+ "▁một▁chút": 39722,
913
+ "▁một▁con": 38596,
914
+ "▁một▁cách": 39625,
915
+ "▁một▁cái": 39381,
916
+ "▁một▁hơi": 38591,
917
+ "▁một▁hồi": 39339,
918
+ "▁một▁lát": 38766,
919
+ "▁một▁lúc": 38377,
920
+ "▁một▁lần": 39355,
921
+ "▁một▁lần▁nữa": 39286,
922
+ "▁một▁mình": 39737,
923
+ "▁một▁người": 39100,
924
+ "▁một▁số": 38493,
925
+ "▁một▁tay": 39609,
926
+ "▁một▁tiế": 38742,
927
+ "▁một▁tiếng": 39186,
928
+ "▁mới▁biết": 39275,
929
+ "▁mới▁có": 38389,
930
+ "▁mới▁có▁thể": 39591,
931
+ "▁mới▁là": 39128,
932
+ "▁mới▁được": 38736,
933
+ "▁mở▁cửa": 39376,
934
+ "▁mở▁ra": 39028,
935
+ "▁mợ": 39348,
936
+ "▁mừ": 39458,
937
+ "▁nam▁nhân": 38521,
938
+ "▁ngay▁cả": 39024,
939
+ "▁ngay▁lập▁tức": 39426,
940
+ "▁nghe▁thấy": 38849,
941
+ "▁nghe▁được": 39493,
942
+ "▁nghiê": 38492,
943
+ "▁nghiêm▁túc": 39650,
944
+ "▁nghiế": 39866,
945
+ "▁nghiề": 38495,
946
+ "▁nghi▁ngờ": 39347,
947
+ "▁nghĩ▁đế": 39228,
948
+ "▁nghỉ▁ngơi": 39283,
949
+ "▁ngoa": 38757,
950
+ "▁ngon▁lành": 38750,
951
+ "▁ngoáy": 38613,
952
+ "▁nguyệ": 39600,
953
+ "▁nguy▁hiểm": 39248,
954
+ "▁ngày▁càng": 39167,
955
+ "▁ngày▁mai": 39751,
956
+ "▁ngón▁tay": 39649,
957
+ "▁ngă": 39502,
958
+ "▁ngăn▁cả": 38432,
959
+ "▁ngươ": 39408,
960
+ "▁người▁khác": 39746,
961
+ "▁người▁lại": 38877,
962
+ "▁người▁phụ▁nữ": 38602,
963
+ "▁người▁ta": 39776,
964
+ "▁người▁yêu": 39181,
965
+ "▁người▁đàn▁bà": 38945,
966
+ "▁người▁đàn▁ông": 39078,
967
+ "▁ngượng▁ng": 38384,
968
+ "▁ngạc▁nhiên": 39839,
969
+ "▁ngẩ": 39485,
970
+ "▁ngắ": 39129,
971
+ "▁ngọ": 39791,
972
+ "▁ngồi▁dậy": 39691,
973
+ "▁ngồi▁xuố": 38767,
974
+ "▁ngụm": 39276,
975
+ "▁nhanh▁chó": 38787,
976
+ "▁nhanh▁hơ": 38544,
977
+ "▁nhiên▁là": 39638,
978
+ "▁nhiều▁hơ": 39931,
979
+ "▁nhiệm▁vụ": 38455,
980
+ "▁nhà▁tắm": 39363,
981
+ "▁nhâ": 38497,
982
+ "▁nhân▁của": 39004,
983
+ "▁nhân▁viên": 38993,
984
+ "▁nhân▁vật": 39552,
985
+ "▁nhè▁nhẹ": 39477,
986
+ "▁nhìn▁qua": 38860,
987
+ "▁nhìn▁thấy": 39742,
988
+ "▁nhìn▁tôi": 39210,
989
+ "▁nhìn▁vào": 39273,
990
+ "▁nhích": 39683,
991
+ "▁nhú": 39337,
992
+ "▁nhă": 39444,
993
+ "▁nhưng▁cũng": 39757,
994
+ "▁nhưng▁không": 39810,
995
+ "▁nhưng▁lại": 38640,
996
+ "▁nhưng▁mà": 39557,
997
+ "▁nhưng▁tôi": 39324,
998
+ "▁nhưng▁vẫ": 38751,
999
+ "▁như▁là": 38985,
1000
+ "▁như▁muố": 38847,
1001
+ "▁như▁một": 38439,
1002
+ "▁như▁thế": 39771,
1003
+ "▁như▁thế▁nào": 39064,
1004
+ "▁như▁thế▁này": 38697,
1005
+ "▁như▁vậy": 39387,
1006
+ "▁như▁vậy▁thì": 38482,
1007
+ "▁như▁đang": 39340,
1008
+ "▁nhả": 38563,
1009
+ "▁nhất▁là": 38410,
1010
+ "▁nhất▁thời": 39927,
1011
+ "▁nhất▁định": 39249,
1012
+ "▁nhậ": 38467,
1013
+ "▁nhận▁ra": 38729,
1014
+ "▁nhận▁được": 39926,
1015
+ "▁nhắ": 39154,
1016
+ "▁nhắm▁mắt": 38654,
1017
+ "▁nhắn▁ti": 39809,
1018
+ "▁nhẹp": 39624,
1019
+ "▁nhẹ▁nhàng": 39611,
1020
+ "▁nhữ": 39169,
1021
+ "▁những▁ch": 39695,
1022
+ "▁những▁gì": 39297,
1023
+ "▁những▁lời": 38983,
1024
+ "▁những▁người": 39798,
1025
+ "▁những▁thứ": 38574,
1026
+ "▁những▁tiế": 39820,
1027
+ "▁nàng▁cũng": 39207,
1028
+ "▁nàng▁không": 38904,
1029
+ "▁nàng▁lại": 38691,
1030
+ "▁nàng▁đang": 38974,
1031
+ "▁nàng▁đã": 39365,
1032
+ "▁nào▁cũng": 39130,
1033
+ "▁nào▁đó": 39850,
1034
+ "▁này▁là": 39396,
1035
+ "▁này▁thì": 39105,
1036
+ "▁nâ": 38771,
1037
+ "▁nãy▁giờ": 39325,
1038
+ "▁nên▁không": 39070,
1039
+ "▁nên▁tôi": 38400,
1040
+ "▁nói▁cho": 38670,
1041
+ "▁nói▁chuyệ": 38696,
1042
+ "▁nói▁chuyện": 39464,
1043
+ "▁nói▁chuyện▁với": 38546,
1044
+ "▁nói▁gì": 38525,
1045
+ "▁nói▁là": 38936,
1046
+ "▁nói▁ra": 38678,
1047
+ "▁nói▁vậy": 39589,
1048
+ "▁nói▁với": 39251,
1049
+ "▁nói▁vừa": 39255,
1050
+ "▁nói▁xong": 38643,
1051
+ "▁nóng▁bỏ": 39351,
1052
+ "▁nó▁cũng": 39727,
1053
+ "▁nó▁lại": 38541,
1054
+ "▁nó▁đang": 38562,
1055
+ "▁nó▁đã": 39052,
1056
+ "▁núm▁vú": 39301,
1057
+ "▁nă": 38790,
1058
+ "▁năm▁nay": 38473,
1059
+ "▁nơi▁này": 39225,
1060
+ "▁nước▁bọt": 39868,
1061
+ "▁nước▁miế": 39715,
1062
+ "▁nước▁mắt": 39469,
1063
+ "▁nước▁nhờ": 39336,
1064
+ "▁nắ": 39123,
1065
+ "▁nắc": 39178,
1066
+ "▁nắm▁lấy": 39420,
1067
+ "▁nắm▁tay": 39418,
1068
+ "▁nặ": 39106,
1069
+ "▁nếu▁như": 38967,
1070
+ "▁nồ": 38698,
1071
+ "▁nụ▁cười": 39282,
1072
+ "▁nụ▁hô": 38639,
1073
+ "▁nứ": 38820,
1074
+ "▁nữa▁mà": 39131,
1075
+ "▁nữ▁nhân": 39356,
1076
+ "▁phiề": 39803,
1077
+ "▁phu▁nhân": 39743,
1078
+ "▁phát▁hiệ": 38469,
1079
+ "▁phát▁ra": 38982,
1080
+ "▁phía▁dưới": 39172,
1081
+ "▁phía▁sau": 39270,
1082
+ "▁phía▁trước": 38802,
1083
+ "▁phò": 39826,
1084
+ "▁phòng▁khách": 39039,
1085
+ "▁phòng▁ngủ": 39113,
1086
+ "▁phòng▁tắm": 39120,
1087
+ "▁phạch": 38676,
1088
+ "▁phả": 39038,
1089
+ "▁phải▁làm": 39358,
1090
+ "▁phấ": 39328,
1091
+ "▁phậ": 39076,
1092
+ "▁phập": 38913,
1093
+ "▁phồ": 39041,
1094
+ "▁phục▁vụ": 39061,
1095
+ "▁phụ▁nữ": 39765,
1096
+ "▁quan▁hệ": 39472,
1097
+ "▁quan▁sát": 39308,
1098
+ "▁quan▁trọ": 38716,
1099
+ "▁quan▁tâm": 39830,
1100
+ "▁quay▁lại": 39921,
1101
+ "▁quay▁sang": 39316,
1102
+ "▁quay▁đầu": 39449,
1103
+ "▁quen▁thuộc": 39056,
1104
+ "▁quyến▁rũ": 39288,
1105
+ "▁quyết▁định": 38641,
1106
+ "▁quyề": 39230,
1107
+ "▁quá▁nhiều": 39421,
1108
+ "▁quảng▁cáo": 39852,
1109
+ "▁quả▁thật": 39596,
1110
+ "▁quấ": 39287,
1111
+ "▁quần▁lót": 39513,
1112
+ "▁quần▁áo": 39922,
1113
+ "▁ra▁khỏi": 39090,
1114
+ "▁ra▁là": 38855,
1115
+ "▁ra▁mà": 39190,
1116
+ "▁ra▁một": 38689,
1117
+ "▁ra▁ngoài": 39334,
1118
+ "▁ra▁rồi": 39575,
1119
+ "▁ra▁sao": 39897,
1120
+ "▁ra▁sau": 39561,
1121
+ "▁ra▁tay": 39011,
1122
+ "▁ra▁thì": 38875,
1123
+ "▁ra▁từ": 38411,
1124
+ "▁ra▁và": 39640,
1125
+ "▁ra▁vào": 39116,
1126
+ "▁ra▁vẻ": 39622,
1127
+ "▁ra▁được": 39639,
1128
+ "▁ra▁để": 39666,
1129
+ "▁riê": 38848,
1130
+ "▁run▁rẩy": 38782,
1131
+ "▁rên▁lên": 39784,
1132
+ "▁rên▁rỉ": 39884,
1133
+ "▁rõ▁ràng": 38530,
1134
+ "▁rùng▁mình": 38725,
1135
+ "▁rút▁ra": 39865,
1136
+ "▁ră": 38425,
1137
+ "▁rất▁nhanh": 38477,
1138
+ "▁rất▁nhiều": 38965,
1139
+ "▁rằ": 39014,
1140
+ "▁rốt▁cuộc": 38891,
1141
+ "▁rồi��cò": 39285,
1142
+ "▁rồi▁lại": 38466,
1143
+ "▁rồi▁mà": 39066,
1144
+ "▁rồi▁mới": 38986,
1145
+ "▁rồi▁thì": 38910,
1146
+ "▁rồi▁tôi": 38460,
1147
+ "▁rồi▁đi": 38603,
1148
+ "▁rồi▁đó": 38744,
1149
+ "▁rồi▁đấy": 39648,
1150
+ "▁rỗ": 39183,
1151
+ "▁rời▁khỏi": 39456,
1152
+ "▁sao▁mà": 38573,
1153
+ "▁sau▁khi": 39937,
1154
+ "▁sau▁lư": 38440,
1155
+ "▁sau▁này": 38480,
1156
+ "▁sau▁đó": 38973,
1157
+ "▁soạ": 38761,
1158
+ "▁so▁với": 38942,
1159
+ "▁sung▁sướ": 39902,
1160
+ "▁suy▁nghĩ": 39932,
1161
+ "▁sá": 38637,
1162
+ "▁sâu▁vào": 39663,
1163
+ "▁sưa": 39055,
1164
+ "▁sướ": 38785,
1165
+ "▁sướng▁lắm": 39859,
1166
+ "▁sướng▁quá": 38971,
1167
+ "▁sư▁phụ": 38589,
1168
+ "▁sạ": 39777,
1169
+ "▁sạch▁sẽ": 38795,
1170
+ "▁sắc▁mặt": 38599,
1171
+ "▁sẵ": 38588,
1172
+ "▁sẵn▁sàng": 39127,
1173
+ "▁sẽ▁có": 39782,
1174
+ "▁sẽ▁không": 39934,
1175
+ "▁sợ▁hãi": 38623,
1176
+ "▁sức▁mạnh": 38378,
1177
+ "▁sử▁dụ": 39185,
1178
+ "▁sự▁thật": 39409,
1179
+ "▁tay▁lên": 38694,
1180
+ "▁tay▁tôi": 39539,
1181
+ "▁tay▁vào": 39880,
1182
+ "▁thanh▁niên": 39716,
1183
+ "▁thay▁đổi": 38408,
1184
+ "▁thoá": 39555,
1185
+ "▁thoải▁mái": 38700,
1186
+ "▁thuậ": 39568,
1187
+ "▁thành▁công": 38590,
1188
+ "▁thành▁một": 38856,
1189
+ "▁thành▁phố": 38898,
1190
+ "▁thào": 38719,
1191
+ "▁thá": 39657,
1192
+ "▁thái▁độ": 39945,
1193
+ "▁thân▁hình": 38570,
1194
+ "▁thân▁phậ": 39174,
1195
+ "▁thân▁thể": 39905,
1196
+ "▁thân▁ảnh": 38663,
1197
+ "▁thêm▁một": 39331,
1198
+ "▁thì▁anh": 39660,
1199
+ "▁thì▁chị": 38957,
1200
+ "▁thì▁có": 39677,
1201
+ "▁thì▁cũng": 39213,
1202
+ "▁thì▁cứ": 38739,
1203
+ "▁thì▁em": 39042,
1204
+ "▁thì▁nó": 39069,
1205
+ "▁thì▁phải": 39598,
1206
+ "▁thì▁sao": 39098,
1207
+ "▁thì▁thấy": 38370,
1208
+ "▁thì▁tôi": 39077,
1209
+ "▁thì▁đã": 39398,
1210
+ "▁thích▁thú": 39151,
1211
+ "▁thím": 39302,
1212
+ "▁thò": 39133,
1213
+ "▁thôi▁chứ": 39615,
1214
+ "▁thôi▁mà": 39150,
1215
+ "▁thông▁ti": 38851,
1216
+ "▁thườ": 39480,
1217
+ "▁thậm▁chí": 38594,
1218
+ "▁thật▁là": 39837,
1219
+ "▁thật▁mạnh": 39057,
1220
+ "▁thật▁sâu": 38443,
1221
+ "▁thật▁sự": 39842,
1222
+ "▁thắ": 38918,
1223
+ "▁thằ": 39126,
1224
+ "▁thằng▁bạ": 39514,
1225
+ "▁thằng▁con": 39229,
1226
+ "▁thằng▁em": 39740,
1227
+ "▁thằng▁này": 39879,
1228
+ "▁thẳ": 38371,
1229
+ "▁thẳng▁vào": 39543,
1230
+ "▁thẹ": 39799,
1231
+ "▁thế▁giới": 39040,
1232
+ "▁thế▁là": 39894,
1233
+ "▁thế▁lực": 39045,
1234
+ "▁thế▁mà": 39821,
1235
+ "▁thế▁nào": 38535,
1236
+ "▁thế▁này": 39059,
1237
+ "▁thỉnh▁thoả": 39621,
1238
+ "▁thọc": 38943,
1239
+ "▁thỏa▁mã": 39413,
1240
+ "▁thố": 38886,
1241
+ "▁thời▁gia": 39060,
1242
+ "▁thở▁dài": 39895,
1243
+ "▁thụt": 38753,
1244
+ "▁thủ▁dâm": 39321,
1245
+ "▁thực▁lực": 39796,
1246
+ "▁thực▁sự": 38938,
1247
+ "▁tinh▁dịch": 38595,
1248
+ "▁tinh▁trù": 39900,
1249
+ "▁tin▁nhắ": 38414,
1250
+ "▁tin▁tức": 39877,
1251
+ "▁tiếng▁rên": 39436,
1252
+ "▁tiến▁vào": 38873,
1253
+ "▁tiếp▁theo": 38674,
1254
+ "▁tiếp▁tục": 38762,
1255
+ "▁tiề": 38560,
1256
+ "▁tiệ": 39534,
1257
+ "▁toàn▁bộ": 39918,
1258
+ "▁toàn▁thân": 38382,
1259
+ "▁toá": 38828,
1260
+ "▁to▁lớ": 38666,
1261
+ "▁triể": 38969,
1262
+ "▁trong▁cái": 39094,
1263
+ "▁trong▁cơ▁thể": 39816,
1264
+ "▁trong▁khi": 39530,
1265
+ "▁trong▁lò": 38464,
1266
+ "▁trong▁lòng": 39734,
1267
+ "▁trong▁lúc": 38743,
1268
+ "▁trong▁lồ": 38937,
1269
+ "▁trong▁miệ": 39171,
1270
+ "▁trong▁mắt": 38435,
1271
+ "▁trong▁một": 39580,
1272
+ "▁trong▁người": 39633,
1273
+ "▁trong▁nhà": 38442,
1274
+ "▁trong▁nhữ": 39495,
1275
+ "▁trong▁phò": 39164,
1276
+ "▁trong▁tay": 39805,
1277
+ "▁trong▁đó": 39662,
1278
+ "▁trong▁đầu": 39139,
1279
+ "▁truyề": 38964,
1280
+ "▁truyền▁th": 38381,
1281
+ "▁truyệ": 39733,
1282
+ "▁trái▁tim": 38483,
1283
+ "▁trên▁mặt": 39422,
1284
+ "▁trên▁người": 39341,
1285
+ "▁trên▁tay": 39006,
1286
+ "▁trôi▁qua": 39438,
1287
+ "▁trước▁khi": 39033,
1288
+ "▁trước▁mắt": 39872,
1289
+ "▁trước▁mặt": 39388,
1290
+ "▁trước▁đây": 38832,
1291
+ "▁trước▁đó": 39048,
1292
+ "▁trườ": 38883,
1293
+ "▁trưở": 39353,
1294
+ "▁trưởng▁lão": 38681,
1295
+ "▁trạ": 39447,
1296
+ "▁trải▁qua": 38584,
1297
+ "▁trả▁lời": 39675,
1298
+ "▁trấ": 39125,
1299
+ "▁trần▁truồ": 38758,
1300
+ "▁trậ": 39332,
1301
+ "▁trắ": 39222,
1302
+ "▁trố": 39558,
1303
+ "▁trở▁lại": 38836,
1304
+ "▁trở▁nên": 39745,
1305
+ "▁trở▁thành": 39718,
1306
+ "▁trở▁về": 39710,
1307
+ "▁trực▁tiếp": 39896,
1308
+ "▁tuyệt▁vời": 38705,
1309
+ "▁tuyệt▁đối": 38816,
1310
+ "▁tuô": 39610,
1311
+ "▁tuổ": 39479,
1312
+ "▁tu▁luyệ": 39488,
1313
+ "▁tác▁dụ": 38809,
1314
+ "▁tìm▁được": 39612,
1315
+ "▁tình▁cảm": 38911,
1316
+ "▁tình▁dục": 39886,
1317
+ "▁tình▁huố": 38380,
1318
+ "▁tình▁hình": 38955,
1319
+ "▁tình▁yêu": 39729,
1320
+ "▁tò▁mò": 38899,
1321
+ "▁tôi▁có": 39636,
1322
+ "▁tôi▁cũng": 39305,
1323
+ "▁tôi▁không": 39423,
1324
+ "▁tôi▁là": 39772,
1325
+ "▁tôi▁lại": 39180,
1326
+ "▁tôi▁mới": 38723,
1327
+ "▁tôi▁nói": 39425,
1328
+ "▁tôi▁ra": 39913,
1329
+ "▁tôi▁sẽ": 38542,
1330
+ "▁tôi▁thì": 39481,
1331
+ "▁tôi▁thấy": 38825,
1332
+ "▁tôi▁và": 39417,
1333
+ "▁tôi▁vẫ": 39804,
1334
+ "▁tôi▁đang": 39819,
1335
+ "▁tôi▁đi": 39173,
1336
+ "▁tôi▁đã": 39322,
1337
+ "▁tă": 39847,
1338
+ "▁tươ": 39498,
1339
+ "▁tướ": 39828,
1340
+ "▁tườ": 39604,
1341
+ "▁tưở": 39329,
1342
+ "▁tưởng▁tượ": 39212,
1343
+ "▁tượ": 39509,
1344
+ "▁tư▁thế": 38490,
1345
+ "▁tại▁sao": 39736,
1346
+ "▁tấn▁công": 39728,
1347
+ "▁tất▁cả": 39247,
1348
+ "▁tầ": 39373,
1349
+ "▁tậ": 39159,
1350
+ "▁tận▁hưở": 39548,
1351
+ "▁tập▁tru": 38630,
1352
+ "▁tặ": 39062,
1353
+ "▁tốc▁độ": 39888,
1354
+ "▁tối▁nay": 38662,
1355
+ "▁tồn▁tại": 38861,
1356
+ "▁tổ▁chức": 38626,
1357
+ "▁tới▁đây": 38557,
1358
+ "▁tụi▁nó": 39697,
1359
+ "▁tức▁giậ": 38638,
1360
+ "▁từ▁chối": 39109,
1361
+ "▁từ▁từ": 39431,
1362
+ "▁từ▁đầu": 39642,
1363
+ "▁tử▁cu": 38882,
1364
+ "▁tự▁nhiên": 38966,
1365
+ "▁tự▁ti": 38867,
1366
+ "▁uố": 38512,
1367
+ "▁vang▁lên": 39705,
1368
+ "▁việ": 39399,
1369
+ "▁việc▁gì": 39242,
1370
+ "▁việc▁này": 39924,
1371
+ "▁vui▁vẻ": 39792,
1372
+ "▁vuốt▁ve": 38781,
1373
+ "▁vài▁cái": 39320,
1374
+ "▁vài▁giây": 39504,
1375
+ "▁vào▁ba": 39690,
1376
+ "▁vào▁bên▁trong": 39290,
1377
+ "▁vào▁cái": 38614,
1378
+ "▁vào▁lò": 39300,
1379
+ "▁vào▁lồ": 39030,
1380
+ "▁vào▁miệ": 39889,
1381
+ "▁vào▁mông": 38776,
1382
+ "▁vào▁mặt": 38486,
1383
+ "▁vào▁một": 39763,
1384
+ "▁vào▁người": 39326,
1385
+ "▁vào▁ngực": 38667,
1386
+ "▁vào▁nhau": 38841,
1387
+ "▁vào▁nhà": 38522,
1388
+ "▁vào▁phò": 38392,
1389
+ "▁vào▁sâu": 39349,
1390
+ "▁vào▁tai": 38500,
1391
+ "▁vào▁trong": 39578,
1392
+ "▁vì▁sao": 39672,
1393
+ "▁vòng▁tay": 38612,
1394
+ "▁vô▁cù": 39272,
1395
+ "▁vô▁cùng": 39117,
1396
+ "▁vô▁số": 39864,
1397
+ "▁vô▁tình": 39148,
1398
+ "▁vù": 39632,
1399
+ "▁vă": 39206,
1400
+ "▁vườ": 39278,
1401
+ "▁vượt▁qua": 39446,
1402
+ "▁vạ": 39605,
1403
+ "▁vấn▁đề": 38404,
1404
+ "▁vẫ": 39143,
1405
+ "▁vẫn▁chưa": 39187,
1406
+ "▁vẫn▁cò": 38951,
1407
+ "▁vẫn▁không": 39606,
1408
+ "▁vẫn▁là": 39410,
1409
+ "▁vẫn▁đang": 39000,
1410
+ "▁vậ": 39452,
1411
+ "▁vậy▁mà": 39203,
1412
+ "▁vậy▁thì": 38928,
1413
+ "▁vắ": 38487,
1414
+ "▁vặ": 38818,
1415
+ "▁vẻ▁mặt": 39293,
1416
+ "▁về▁nhà": 39311,
1417
+ "▁về▁phía": 39841,
1418
+ "▁về▁sau": 39497,
1419
+ "▁vệ▁sinh": 39124,
1420
+ "▁vị▁trí": 38890,
1421
+ "▁vọ": 39887,
1422
+ "▁vố": 38445,
1423
+ "▁vội▁vàng": 38803,
1424
+ "▁với▁anh": 38939,
1425
+ "▁với▁chị": 39726,
1426
+ "▁với▁con": 38555,
1427
+ "▁với▁cái": 39022,
1428
+ "▁với▁cô": 39032,
1429
+ "▁với▁em": 39536,
1430
+ "▁với▁mẹ": 38731,
1431
+ "▁với▁một": 39459,
1432
+ "▁với▁người": 39370,
1433
+ "▁với▁nhau": 39294,
1434
+ "▁với▁nhữ": 38896,
1435
+ "▁với▁nó": 38745,
1436
+ "▁với▁tôi": 39470,
1437
+ "▁vợ▁chồ": 38622,
1438
+ "▁vợ▁tôi": 39944,
1439
+ "▁vừa▁mới": 39411,
1440
+ "▁vừa▁rồi": 39019,
1441
+ "▁xinh▁đẹp": 39912,
1442
+ "▁xin▁lỗ": 38617,
1443
+ "▁xin▁lỗi": 39191,
1444
+ "▁xoa▁bóp": 38715,
1445
+ "▁xoa▁xoa": 39858,
1446
+ "▁xong▁rồi": 39102,
1447
+ "▁xong▁thì": 39211,
1448
+ "▁xung▁quanh": 38453,
1449
+ "▁xuất▁hiệ": 39635,
1450
+ "▁xuất▁tinh": 39177,
1451
+ "▁xuố": 38611,
1452
+ "▁xuống▁dưới": 39822,
1453
+ "▁xuống▁đất": 38774,
1454
+ "▁xảy▁ra": 39508,
1455
+ "▁xấu▁hổ": 38631,
1456
+ "▁xắ": 39768,
1457
+ "▁yên▁tâm": 39309,
1458
+ "▁yêu▁cầu": 39869,
1459
+ "▁yêu▁thương": 38537,
1460
+ "▁ánh▁mắt": 38826,
1461
+ "▁ánh▁sá": 39518,
1462
+ "▁âm▁hộ": 38675,
1463
+ "▁âm▁thanh": 38664,
1464
+ "▁âm▁thầm": 38413,
1465
+ "▁âm▁đạo": 39686,
1466
+ "▁ôm▁lấy": 38770,
1467
+ "▁ông▁ta": 39523,
1468
+ "▁ông▁ấy": 39434,
1469
+ "▁ăn▁cơm": 38679,
1470
+ "▁Đinh▁Nhị▁Cẩu": 39144,
1471
+ "▁Đinh▁Trường▁Sinh": 39699,
1472
+ "▁Đức▁Tam": 39767,
1473
+ "▁đang▁bị": 39712,
1474
+ "▁đang▁ngồi": 38661,
1475
+ "▁đang▁nằm": 38652,
1476
+ "▁đau▁đớ": 39392,
1477
+ "▁điên▁cuồ": 39813,
1478
+ "▁điều▁gì": 39259,
1479
+ "▁điều▁kiệ": 38853,
1480
+ "▁điều▁này": 39050,
1481
+ "▁điều▁đó": 38944,
1482
+ "▁điệ": 38885,
1483
+ "▁điện▁thoại": 38506,
1484
+ "▁đi▁anh": 38924,
1485
+ "▁đi▁chơi": 39704,
1486
+ "▁đi▁em": 39812,
1487
+ "▁đi▁học": 39825,
1488
+ "▁đi▁làm": 39938,
1489
+ "▁đi▁qua": 39306,
1490
+ "▁đi▁ra": 39565,
1491
+ "▁đi▁ra▁ngoài": 38618,
1492
+ "▁đi▁rồi": 39551,
1493
+ "▁đi▁theo": 39192,
1494
+ "▁đi▁tới": 39592,
1495
+ "▁đi▁vào": 39914,
1496
+ "▁đi▁về": 39800,
1497
+ "▁đi▁đâu": 39021,
1498
+ "▁đi▁đế": 38713,
1499
+ "▁đoà": 39707,
1500
+ "▁đoá": 39861,
1501
+ "▁đoạ": 38375,
1502
+ "▁đàn▁bà": 39658,
1503
+ "▁đàn▁ông": 39503,
1504
+ "▁đám▁người": 39156,
1505
+ "▁đâu▁có": 38452,
1506
+ "▁đâu▁mà": 39198,
1507
+ "▁đây▁là": 39537,
1508
+ "▁đã▁bị": 39005,
1509
+ "▁đã▁có": 39026,
1510
+ "▁đã▁là": 38658,
1511
+ "▁đã▁làm": 39097,
1512
+ "▁đã▁quá": 38373,
1513
+ "▁đã▁được": 39079,
1514
+ "▁đéo": 38456,
1515
+ "▁đêm▁nay": 39893,
1516
+ "▁đê▁mê": 39643,
1517
+ "▁đít": 39385,
1518
+ "▁đóng▁cửa": 39719,
1519
+ "▁đó▁là": 39586,
1520
+ "▁đó▁mà": 39221,
1521
+ "▁đó▁thì": 39268,
1522
+ "▁đôi▁môi": 38488,
1523
+ "▁đôi▁mắt": 39008,
1524
+ "▁đù": 39153,
1525
+ "▁đú": 39209,
1526
+ "▁đúng▁là": 39256,
1527
+ "▁đút": 39103,
1528
+ "▁đút▁vào": 38797,
1529
+ "▁đơn▁giả": 38961,
1530
+ "▁đưa▁tay": 38732,
1531
+ "▁đương▁nhiên": 38503,
1532
+ "▁đườ": 39801,
1533
+ "▁được▁một": 39162,
1534
+ "▁được▁nữa": 38682,
1535
+ "▁đầu▁khấc": 39815,
1536
+ "▁đầu▁tiên": 39487,
1537
+ "▁đầu▁óc": 38536,
1538
+ "▁đằng▁sau": 39532,
1539
+ "▁đặ": 39669,
1540
+ "▁đặc▁biệt": 39834,
1541
+ "▁đến▁ch": 38429,
1542
+ "▁đến▁giờ": 38665,
1543
+ "▁đến▁kh": 39343,
1544
+ "▁đến▁khi": 38669,
1545
+ "▁đến▁lúc": 39547,
1546
+ "▁đến▁mức": 39466,
1547
+ "▁đến▁nhà": 39546,
1548
+ "▁đến▁đây": 39505,
1549
+ "▁đều▁là": 39170,
1550
+ "▁để▁cho": 38505,
1551
+ "▁để▁em": 39404,
1552
+ "▁đệ▁tử": 39330,
1553
+ "▁địt": 39807,
1554
+ "▁đỏ▁mặt": 39506,
1555
+ "▁đối▁diệ": 38561,
1556
+ "▁đối▁phương": 39814,
1557
+ "▁đối▁thủ": 39512,
1558
+ "▁đối▁với": 38869,
1559
+ "▁đồng▁thời": 38597,
1560
+ "▁động▁tác": 39433,
1561
+ "▁đột▁nhiên": 39706,
1562
+ "▁đớ": 39475,
1563
+ "▁đợ": 39414,
1564
+ "▁đụ": 38668,
1565
+ "▁đứ": 39145,
1566
+ "▁đứa▁con▁gái": 38768,
1567
+ "▁đứng▁dậy": 38737,
1568
+ "▁đứng▁lên": 38423,
1569
+ "▁đừ": 39269,
1570
+ "▁đừng▁có": 38438,
1571
+ "▁đự": 39747,
1572
+ "▁ướt▁đẫm": 39263,
1573
+ "▁ưỡ": 39684,
1574
+ "▁ảnh▁hưở": 39875,
1575
+ "▁ấm▁áp": 38870,
1576
+ "▁ở▁dưới": 39738,
1577
+ "▁ở▁lại": 38714,
1578
+ "▁ở▁nhà": 39544,
1579
+ "▁ở▁trong": 39626,
1580
+ "▁ở▁trên": 39940,
1581
+ "▁ở▁đâu": 39670,
1582
+ "▁ở▁đây": 39017,
1583
+ "▁ở▁đó": 39182
1584
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,35 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "additional_special_tokens": [
3
+ "<unk>",
4
+ "<s>",
5
+ "</s>"
6
+ ],
7
+ "bos_token": {
8
+ "content": "<s>",
9
+ "lstrip": false,
10
+ "normalized": false,
11
+ "rstrip": false,
12
+ "single_word": false
13
+ },
14
+ "eos_token": {
15
+ "content": "</s>",
16
+ "lstrip": false,
17
+ "normalized": false,
18
+ "rstrip": false,
19
+ "single_word": false
20
+ },
21
+ "pad_token": {
22
+ "content": "<unk>",
23
+ "lstrip": false,
24
+ "normalized": false,
25
+ "rstrip": false,
26
+ "single_word": false
27
+ },
28
+ "unk_token": {
29
+ "content": "<unk>",
30
+ "lstrip": false,
31
+ "normalized": false,
32
+ "rstrip": false,
33
+ "single_word": false
34
+ }
35
+ }
tokenizer.json ADDED
The diff for this file is too large to render. See raw diff
 
tokenizer.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:e792a804bbfc19a96b61b87109b8f2b0b7c92830025f285b402ba27c0c309c6f
3
+ size 596883
tokenizer_config.json ADDED
The diff for this file is too large to render. See raw diff