Transformers documentation
Inferenza Efficiente su GPU Multiple
You are viewing main version, which requires installation from source. If you'd like
			regular pip install, checkout the latest stable version (v4.57.1).
		
Inferenza Efficiente su GPU Multiple
Questo documento contiene informazioni su come fare inferenza in maniera efficiente su GPU multiple.
Update on GitHubNota: Un setup con GPU multiple può utilizzare la maggior parte delle strategie descritte nella sezione con GPU singola. Tuttavia, è necessario conoscere delle tecniche semplici che possono essere utilizzate per un risultato migliore.