File size: 1,648 Bytes
0f402b6
00b26d5
 
 
 
 
 
 
 
 
 
 
 
 
0f402b6
 
00b26d5
0f402b6
00b26d5
0f402b6
00b26d5
0f402b6
00b26d5
 
 
 
 
 
 
 
0f402b6
00b26d5
0f402b6
00b26d5
0f402b6
00b26d5
 
0f402b6
00b26d5
 
 
 
45faf00
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
---
license: mit
tags:
- text-classification
- japanese
- vtuber
- finetuned
widget:
- type: inference
  modelId: your_username/modernbert-vtuber-finetuned
language:
- ja
base_model:
- sbintuitions/modernbert-ja-130m
---

# ModernBERT-VTuber Finetuned

このモデルは [sbintuitions/modernbert-ja-130m](https://huggingface.co/sbintuitions/modernbert-ja-130m) をベースに、YouTube チャンネルのタイトル・説明などのテキスト情報から VTuber か否かを判定するためにファインチューニングしたモデルです。

## モデル詳細

- **ベースモデル:** ModernBERT-Ja-130M
- **タスク:** 2値分類(VTuber: 1, 非VTuber: 0)
- **トレーニングデータ:** YouTube のチャンネルメタデータ(タイトル、説明、テキスト)
- **トレーニングパラメータ:**
  - エポック数: 3
  - バッチサイズ: 4(デバイス毎)
  - 学習率: 2e-5
  - 混合精度 (fp16) を Trainer 側で有効化

## 使い方

以下のコード例で推論できます。

```python
from transformers import AutoTokenizer, AutoModelForSequenceClassification, pipeline

tokenizer = AutoTokenizer.from_pretrained("your_username/modernbert-vtuber-finetuned")
model = AutoModelForSequenceClassification.from_pretrained("your_username/modernbert-vtuber-finetuned")
vtuber_classifier = pipeline("text-classification", model=model, tokenizer=tokenizer)
result = vtuber_classifier("この動画では、バーチャルなキャラクターがリアルタイムに動く様子を配信しています。")
print(result)

# 入力文章の判定結果:
# {'isVTuber': True, 'rate': 100.0}