tinyllama-tensorrt / README.md

Create README.md

a11e19e verified 12 months ago

252 Bytes

metadata

license: mit
language:
  - en
tags:
  - text-generation-inference
  - text

TinyLLama TensorRT LLM Edition.

This repo contains the TensorRT LLM version of TinyLlama Model. The conversion is done to support Float16 precision on Nvidia TensorRT.