YAML Metadata Warning: empty or missing yaml metadata in repo card (https://huggingface.co/docs/hub/model-cards#model-card-metadata)

Interactive Refinement Enhanced granite-3.3-8b-instruct

概要

Interactive Refinement技術により強化されたIBM Granite 3.2Bモデルです。 通常の推論を3回反復実行し、段階的に回答を改善することで、より高品質な推論能力を実現します。

モデル情報

  • ベースモデル: ibm-granite/granite-3.3-8b-instruct
  • Interactive Refinement設定: 3回反復推論
  • 強化対象: 論理推論、複雑な問題解決、創造的思考

使用方法

基本的な使用

from ir_inference import InteractiveRefinementInferenceModel

# モデルロード
model = InteractiveRefinementInferenceModel("./")

# Interactive Refinement推論実行
result = model.generate_interactive_refinement("論理的に考えてください: すべての猫は動物である。ミケは猫である。では、ミケは?")
print(result)

Transformersライブラリとの統合

from transformers import AutoTokenizer, AutoModelForCausalLM

# 通常のTransformersとして使用(ベースモデル)
tokenizer = AutoTokenizer.from_pretrained("./")
model = AutoModelForCausalLM.from_pretrained("./", trust_remote_code=True)

# または、Interactive Refinement機能付きで使用
from ir_inference import InteractiveRefinementInferenceModel
ir_model = InteractiveRefinementInferenceModel("./")

特徴

  • 段階的改善: 初回回答を基に、複数回の推論で段階的に回答品質を向上
  • 自己批判機能: 自分の回答を批判して改善する機能
  • 温度制御: 初期は多様性、改善時は安定性を重視した生成制御

技術詳細

  • 反復推論: 各推論ステップで前回の出力を改善
  • プロンプト設計: 改善指向のプロンプトテンプレート
  • 生成制御: 段階に応じた温度とサンプリング制御

評価結果

詳細な評価結果は evaluation_results.json を参照してください。

ライセンス

ベースモデル(IBM Granite)のライセンスに従います。

Downloads last month
12
Safetensors
Model size
8.17B params
Tensor type
F16
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support