François Mentec commited on
Commit
e4275fc
·
1 Parent(s): 9e2cee5

groundtruth

Browse files
.gitignore ADDED
@@ -0,0 +1 @@
 
 
1
+ data/documents
data/ground_truth/BLC_000_2025_27187.PDF.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "type": "aliment composé",
4
+ "denomination": null,
5
+ "commercial_name": "MEGA VALAC 500"
6
+ }
7
+ ]
data/ground_truth/CCL00020250023366_2.pdf.json ADDED
@@ -0,0 +1,34 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "type": "aliment composé",
4
+ "dénomination": "PRO FLORE",
5
+ "nom commercial": "PRO FLORE",
6
+ "raison sociale étiquetage": "S.A.S. MAISON FRANCOIS CHOLAT",
7
+ "adresse étiquetage": "1310 route de Thuile 38510 MORSTEL",
8
+ "vrac": true,
9
+ "quantité": 2640,
10
+ "additifs": [
11
+ "substances aromatiques",
12
+ "urée et ses dérivés"
13
+ ],
14
+ "matières premières": [
15
+ "Tourteau feed stock d'extraction de soja cuit (produit à partir de soja OGM)",
16
+ "Tourteau feed stock d'extraction de colza",
17
+ "Tourteau feed d'extraction de tournesol (graine décortiquée)",
18
+ "Solubles de fabrication d'Acides Aminés"
19
+ ],
20
+ "mode d'emploi": "Distribuer aux bovins dans les rations déficitaires en protéines à raison de 0,5 à 3 kg par animal et jour en fonction des fourrages et des objectifs de production. Consultez notre technicien. Eau propre et fraîche à discrétion. Conserver ce produit à l’abri de l’air, de la chaleur, de la lumière et de l’humidité. Conforme au référentiel CC/80/09 FQC.",
21
+ "valeur nutritionelle": [
22
+ "Protéine brute 43.1%",
23
+ "Matières grasses 1.4%",
24
+ "Cellulose brute 10.9%",
25
+ "Cendres brutes (matières minérales) 6.4%",
26
+ "Calcium 0.51%",
27
+ "Phosphore 0.87%",
28
+ "Sodium 0.07%"
29
+ ],
30
+ "animaux": "bovin",
31
+ "bio": false,
32
+ "ogm": false
33
+ }
34
+ ]
data/schema.json ADDED
@@ -0,0 +1,108 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "type": "array",
3
+ "items": {
4
+ "type": "object",
5
+ "properties": {
6
+ "type": {
7
+ "type": "string",
8
+ "enum": [
9
+ "fourrage",
10
+ "aliment composé",
11
+ "matière première"
12
+ ]
13
+ },
14
+ "dénomination": {
15
+ "type": "string"
16
+ },
17
+ "nom commercial": {
18
+ "type": "string"
19
+ },
20
+ "raison sociale étiquetage": {
21
+ "type": "string"
22
+ },
23
+ "adresse étiquetage": {
24
+ "type": "string"
25
+ },
26
+ "vrac": {
27
+ "type": "boolean"
28
+ },
29
+ "quantité": {
30
+ "type": "integer"
31
+ },
32
+ "additifs": {
33
+ "type": "array",
34
+ "items": {
35
+ "type": "string",
36
+ "enum": [
37
+ "conservateurs",
38
+ "antioxygènes",
39
+ "émulsifiants",
40
+ "stabilisants",
41
+ "épaississants",
42
+ "gélifiants",
43
+ "liants",
44
+ "substances pour le contrôle de contamination de radionucléides",
45
+ "anti-agglomérants",
46
+ "correcteurs d'acidité",
47
+ "additifs pour l'ensilage",
48
+ "dénaturants",
49
+ "substances destinées à réduire la contamination des aliments pour animaux par les mycotoxines",
50
+ "améliorateurs des conditions d'hygiène",
51
+ "autres additifs technologiques",
52
+ "colorants",
53
+ "substances aromatiques",
54
+ "vitamines, provitamines et substances à effet analogue chimiquement bien définies",
55
+ "composés d'oligo-éléments",
56
+ "acides aminés, leurs sels et produits analogues",
57
+ "urée et ses dérivés",
58
+ "améliorateurs de digestibilité",
59
+ "stabilisateurs de la flore intestinale",
60
+ "substances qui ont un effet positif sur l'environnement",
61
+ "autres additifs zootechniques",
62
+ "stabilisateurs de l'état physiologique"
63
+ ]
64
+ }
65
+ },
66
+ "matières premières": {
67
+ "type": "array",
68
+ "items": {
69
+ "type": "string"
70
+ }
71
+ },
72
+ "mode d'emploi": {
73
+ "type": "string"
74
+ },
75
+ "valeur nutritionelle": {
76
+ "type": "array",
77
+ "items": {
78
+ "type": "string"
79
+ }
80
+ },
81
+ "animaux": {
82
+ "type": "string"
83
+ },
84
+ "bio": {
85
+ "type": "boolean"
86
+ },
87
+ "ogm": {
88
+ "type": "boolean"
89
+ }
90
+ },
91
+ "required": [
92
+ "type",
93
+ "dénomination",
94
+ "nom commercial",
95
+ "raison sociale étiquetage",
96
+ "adresse étiquetage",
97
+ "vrac",
98
+ "quantité",
99
+ "additifs",
100
+ "matières premières",
101
+ "mode d'emploi",
102
+ "valeur nutritionelle",
103
+ "animaux",
104
+ "bio",
105
+ "ogm"
106
+ ]
107
+ }
108
+ }