François Mentec
commited on
Commit
·
e4275fc
1
Parent(s):
9e2cee5
groundtruth
Browse files- .gitignore +1 -0
- data/ground_truth/BLC_000_2025_27187.PDF.json +7 -0
- data/ground_truth/CCL00020250023366_2.pdf.json +34 -0
- data/schema.json +108 -0
.gitignore
ADDED
|
@@ -0,0 +1 @@
|
|
|
|
|
|
|
| 1 |
+
data/documents
|
data/ground_truth/BLC_000_2025_27187.PDF.json
ADDED
|
@@ -0,0 +1,7 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
[
|
| 2 |
+
{
|
| 3 |
+
"type": "aliment composé",
|
| 4 |
+
"denomination": null,
|
| 5 |
+
"commercial_name": "MEGA VALAC 500"
|
| 6 |
+
}
|
| 7 |
+
]
|
data/ground_truth/CCL00020250023366_2.pdf.json
ADDED
|
@@ -0,0 +1,34 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
[
|
| 2 |
+
{
|
| 3 |
+
"type": "aliment composé",
|
| 4 |
+
"dénomination": "PRO FLORE",
|
| 5 |
+
"nom commercial": "PRO FLORE",
|
| 6 |
+
"raison sociale étiquetage": "S.A.S. MAISON FRANCOIS CHOLAT",
|
| 7 |
+
"adresse étiquetage": "1310 route de Thuile 38510 MORSTEL",
|
| 8 |
+
"vrac": true,
|
| 9 |
+
"quantité": 2640,
|
| 10 |
+
"additifs": [
|
| 11 |
+
"substances aromatiques",
|
| 12 |
+
"urée et ses dérivés"
|
| 13 |
+
],
|
| 14 |
+
"matières premières": [
|
| 15 |
+
"Tourteau feed stock d'extraction de soja cuit (produit à partir de soja OGM)",
|
| 16 |
+
"Tourteau feed stock d'extraction de colza",
|
| 17 |
+
"Tourteau feed d'extraction de tournesol (graine décortiquée)",
|
| 18 |
+
"Solubles de fabrication d'Acides Aminés"
|
| 19 |
+
],
|
| 20 |
+
"mode d'emploi": "Distribuer aux bovins dans les rations déficitaires en protéines à raison de 0,5 à 3 kg par animal et jour en fonction des fourrages et des objectifs de production. Consultez notre technicien. Eau propre et fraîche à discrétion. Conserver ce produit à l’abri de l’air, de la chaleur, de la lumière et de l’humidité. Conforme au référentiel CC/80/09 FQC.",
|
| 21 |
+
"valeur nutritionelle": [
|
| 22 |
+
"Protéine brute 43.1%",
|
| 23 |
+
"Matières grasses 1.4%",
|
| 24 |
+
"Cellulose brute 10.9%",
|
| 25 |
+
"Cendres brutes (matières minérales) 6.4%",
|
| 26 |
+
"Calcium 0.51%",
|
| 27 |
+
"Phosphore 0.87%",
|
| 28 |
+
"Sodium 0.07%"
|
| 29 |
+
],
|
| 30 |
+
"animaux": "bovin",
|
| 31 |
+
"bio": false,
|
| 32 |
+
"ogm": false
|
| 33 |
+
}
|
| 34 |
+
]
|
data/schema.json
ADDED
|
@@ -0,0 +1,108 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"type": "array",
|
| 3 |
+
"items": {
|
| 4 |
+
"type": "object",
|
| 5 |
+
"properties": {
|
| 6 |
+
"type": {
|
| 7 |
+
"type": "string",
|
| 8 |
+
"enum": [
|
| 9 |
+
"fourrage",
|
| 10 |
+
"aliment composé",
|
| 11 |
+
"matière première"
|
| 12 |
+
]
|
| 13 |
+
},
|
| 14 |
+
"dénomination": {
|
| 15 |
+
"type": "string"
|
| 16 |
+
},
|
| 17 |
+
"nom commercial": {
|
| 18 |
+
"type": "string"
|
| 19 |
+
},
|
| 20 |
+
"raison sociale étiquetage": {
|
| 21 |
+
"type": "string"
|
| 22 |
+
},
|
| 23 |
+
"adresse étiquetage": {
|
| 24 |
+
"type": "string"
|
| 25 |
+
},
|
| 26 |
+
"vrac": {
|
| 27 |
+
"type": "boolean"
|
| 28 |
+
},
|
| 29 |
+
"quantité": {
|
| 30 |
+
"type": "integer"
|
| 31 |
+
},
|
| 32 |
+
"additifs": {
|
| 33 |
+
"type": "array",
|
| 34 |
+
"items": {
|
| 35 |
+
"type": "string",
|
| 36 |
+
"enum": [
|
| 37 |
+
"conservateurs",
|
| 38 |
+
"antioxygènes",
|
| 39 |
+
"émulsifiants",
|
| 40 |
+
"stabilisants",
|
| 41 |
+
"épaississants",
|
| 42 |
+
"gélifiants",
|
| 43 |
+
"liants",
|
| 44 |
+
"substances pour le contrôle de contamination de radionucléides",
|
| 45 |
+
"anti-agglomérants",
|
| 46 |
+
"correcteurs d'acidité",
|
| 47 |
+
"additifs pour l'ensilage",
|
| 48 |
+
"dénaturants",
|
| 49 |
+
"substances destinées à réduire la contamination des aliments pour animaux par les mycotoxines",
|
| 50 |
+
"améliorateurs des conditions d'hygiène",
|
| 51 |
+
"autres additifs technologiques",
|
| 52 |
+
"colorants",
|
| 53 |
+
"substances aromatiques",
|
| 54 |
+
"vitamines, provitamines et substances à effet analogue chimiquement bien définies",
|
| 55 |
+
"composés d'oligo-éléments",
|
| 56 |
+
"acides aminés, leurs sels et produits analogues",
|
| 57 |
+
"urée et ses dérivés",
|
| 58 |
+
"améliorateurs de digestibilité",
|
| 59 |
+
"stabilisateurs de la flore intestinale",
|
| 60 |
+
"substances qui ont un effet positif sur l'environnement",
|
| 61 |
+
"autres additifs zootechniques",
|
| 62 |
+
"stabilisateurs de l'état physiologique"
|
| 63 |
+
]
|
| 64 |
+
}
|
| 65 |
+
},
|
| 66 |
+
"matières premières": {
|
| 67 |
+
"type": "array",
|
| 68 |
+
"items": {
|
| 69 |
+
"type": "string"
|
| 70 |
+
}
|
| 71 |
+
},
|
| 72 |
+
"mode d'emploi": {
|
| 73 |
+
"type": "string"
|
| 74 |
+
},
|
| 75 |
+
"valeur nutritionelle": {
|
| 76 |
+
"type": "array",
|
| 77 |
+
"items": {
|
| 78 |
+
"type": "string"
|
| 79 |
+
}
|
| 80 |
+
},
|
| 81 |
+
"animaux": {
|
| 82 |
+
"type": "string"
|
| 83 |
+
},
|
| 84 |
+
"bio": {
|
| 85 |
+
"type": "boolean"
|
| 86 |
+
},
|
| 87 |
+
"ogm": {
|
| 88 |
+
"type": "boolean"
|
| 89 |
+
}
|
| 90 |
+
},
|
| 91 |
+
"required": [
|
| 92 |
+
"type",
|
| 93 |
+
"dénomination",
|
| 94 |
+
"nom commercial",
|
| 95 |
+
"raison sociale étiquetage",
|
| 96 |
+
"adresse étiquetage",
|
| 97 |
+
"vrac",
|
| 98 |
+
"quantité",
|
| 99 |
+
"additifs",
|
| 100 |
+
"matières premières",
|
| 101 |
+
"mode d'emploi",
|
| 102 |
+
"valeur nutritionelle",
|
| 103 |
+
"animaux",
|
| 104 |
+
"bio",
|
| 105 |
+
"ogm"
|
| 106 |
+
]
|
| 107 |
+
}
|
| 108 |
+
}
|