Training in progress, epoch 1

Browse files

Files changed (4) hide show

README.md +7 -51
model.safetensors +1 -1
runs/Jun01_04-17-38_ip-10-192-12-140/events.out.tfevents.1748751467.ip-10-192-12-140.2205.0 +3 -0
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -39,69 +39,25 @@ should probably proofread and complete it, then remove this comment. -->
 # cv_animals
-## Model description
-Dieses Modell ist ein feingetuntes Vision Transformer (ViT) Modell, das auf dem vortrainierten [google/vit-base-patch16-224](https://huggingface.co/google/vit-base-patch16-224) basiert. Es wurde speziell für die Klassifikation von Bildern in 90 verschiedene Tierklassen trainiert. Die zugrunde liegenden Daten stammen aus dem öffentlich verfügbaren Animal Image Dataset, das Bilder aus Google aggregiert.
-Das Modell eignet sich für Anwendungen, bei denen Tiere auf Fotos automatisch erkannt und klassifiziert werden sollen. Typische Einsatzgebiete sind beispielsweise:
-- automatisierte Artenbestimmung,
-- bildgestützte Tierdatenerfassung in Forschung und Lehre,
-- edukative oder interaktive Anwendungen (z. B. in Museen oder Apps).
-Folgende Resultate werden generiert:
 - Loss: 0.0833
 - Accuracy: 0.9870
-## Intended uses & limitations
-### Vorgesehene Verwendungen
-Dieses Modell wurde für die Bildklassifikation von Tieren in 90 Kategorien entwickelt. Es eignet sich insbesondere für:
-- Bildbasierte Tiererkennung in Anwendungen wie Lernplattformen, mobilen Apps, oder interaktiven Tools
-- Unterstützung bei biologischer Arterkennung (z. B. für Bildungsprojekte oder Citizen Science)
-- Vergleich von Transfer-Learning-Modellen mit Zero-Shot-Modellen (z. B. CLIP)
-### Einschränkungen
-- Die Vorhersagen sind stark abhängig von Bildqualität und Perspektive
-- Das Modell wurde nur mit Bildern aus dem Kaggle-Datensatz trainiert – es ist nicht garantiert, dass es bei anderen Tierarten oder in freier Wildbahn korrekt klassifiziert
-- Mehrdeutige oder unklare Bilder (z. B. mit mehreren Tieren, Zeichnungen, Verdeckungen) können zu falschen Vorhersagen führen
-- Keine Garantien für den professionellen oder medizinischen Einsatz
 ## Training and evaluation data
-Datensatz: Animal Image Dataset - 90 different animals
-Anzahl Bilder: 5.400
-Klassen: 90 Tierarten (z. B. Hund, Katze, Elefant, Biene, Löwe etc.)
-Aufteilung:
-80 % Training (4.320 Bilder)
-10 % Validierung (540 Bilder)
-10 % Test (540 Bilder)
-### Augmentierungen
-Zur Verbesserung der Generalisierbarkeit wurden folgende Transformationen auf die Trainingsbilder angewendet:
-RandomHorizontalFlip() – zufälliges horizontales Spiegeln
-RandomRotation(25) – zufällige Drehung um ±25°
-ColorJitter() – zufällige Helligkeits-, Kontrast-, Sättigungs- und Farbtonänderungen
 ## Training procedure
-Das Modell basiert auf Vision Transformer (ViT) mit der Architektur:
-google/vit-base-patch16-224, einem vortrainierten Modell auf ImageNet-21k.
-Für das Transfer Learning wurde ausschliesslich der Klassifikationskopf (classifier) neu initialisiert und trainiert, während alle anderen Modellparameter eingefroren wurden (requires_grad=False), um die vortrainierten Features optimal zu nutzen.
 ### Training hyperparameters
 The following hyperparameters were used during training:

 # cv_animals
+This model is a fine-tuned version of [google/vit-base-patch16-224](https://huggingface.co/google/vit-base-patch16-224) on the animals dataset.
+It achieves the following results on the evaluation set:
 - Loss: 0.0833
 - Accuracy: 0.9870
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
 ## Training and evaluation data
+More information needed
 ## Training procedure
 ### Training hyperparameters
 The following hyperparameters were used during training:

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5c8dbe3b48a8e7a65485c4f0cd6c150c0e04b7c6a7eeb7841eb45b65b1d9b362
 size 343494672

 version https://git-lfs.github.com/spec/v1
+oid sha256:01c8eba869d81224cdcd1601d25151a93aaa4a939e61479f4fde1cbae80ed91a
 size 343494672

runs/Jun01_04-17-38_ip-10-192-12-140/events.out.tfevents.1748751467.ip-10-192-12-140.2205.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b1b8356104670785132311c0c084138aa2510c6102214636258cea4f046d9205
+size 9203

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:66fa0a33e6cf7dc39b3ce2ac305107a71d58c5e9ae20fb323b2d574fe6f7444e
 size 5368

 version https://git-lfs.github.com/spec/v1
+oid sha256:02542a35597f69a75766f084b375dd83945042cf11ae6dbb02b237b212da3f83
 size 5368