hiroshij
/

ir-enhanced-granite-3.3-8b

Model card Files Files and versions

YAML Metadata Warning: empty or missing yaml metadata in repo card (https://huggingface.co/docs/hub/model-cards#model-card-metadata)

Interactive Refinement Enhanced granite-3.3-8b-instruct

概要

Interactive Refinement技術により強化されたIBM Granite 3.2Bモデルです。通常の推論を3回反復実行し、段階的に回答を改善することで、より高品質な推論能力を実現します。

モデル情報

ベースモデル: ibm-granite/granite-3.3-8b-instruct
Interactive Refinement設定: 3回反復推論
強化対象: 論理推論、複雑な問題解決、創造的思考

使用方法

基本的な使用

from ir_inference import InteractiveRefinementInferenceModel

# モデルロード
model = InteractiveRefinementInferenceModel("./")

# Interactive Refinement推論実行
result = model.generate_interactive_refinement("論理的に考えてください: すべての猫は動物である。ミケは猫である。では、ミケは？")
print(result)

Transformersライブラリとの統合

from transformers import AutoTokenizer, AutoModelForCausalLM

# 通常のTransformersとして使用（ベースモデル）
tokenizer = AutoTokenizer.from_pretrained("./")
model = AutoModelForCausalLM.from_pretrained("./", trust_remote_code=True)

# または、Interactive Refinement機能付きで使用
from ir_inference import InteractiveRefinementInferenceModel
ir_model = InteractiveRefinementInferenceModel("./")

特徴

段階的改善: 初回回答を基に、複数回の推論で段階的に回答品質を向上
自己批判機能: 自分の回答を批判して改善する機能
温度制御: 初期は多様性、改善時は安定性を重視した生成制御

技術詳細

反復推論: 各推論ステップで前回の出力を改善
プロンプト設計: 改善指向のプロンプトテンプレート
生成制御: 段階に応じた温度とサンプリング制御

評価結果

詳細な評価結果は evaluation_results.json を参照してください。

ライセンス

ベースモデル（IBM Granite）のライセンスに従います。

Downloads last month: 12

Safetensors

Model size

8.17B params

Tensor type

F16

·

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support