Có thể chỉ mình thông số finetune mô hình
Cảm ơn Nhóm rất nhiều, mình dùng thử thì thấy model nhận diện tiếng Việt với độ chính xác cao hơn rất nhiều so với những mô hình lớn thương mại ( Qwen VL-plus, LLama vision...) . Nhưng mình nhận thấy với khá nhiều loại tài liệu ( hóa đơn, toa thuốc...) thì model bỏ qua phần footer . Nhóm có thể chỉ mình cách finetune lại được không? hoặc cho đường link để tìm hiểu. Mình muốn dùng model để OCR hóa đơn và một số chứng từ y tế.
Xin cảm ơn nhiều
Bạn follow theo Google colab này nhé: https://colab.research.google.com/drive/1bK6fpWfResjv9UxWoKHDStXQ8bop3a6Z?usp=sharing
Cảm ơn bạn nhiều lắm
Bạn follow theo Google colab này nhé: https://colab.research.google.com/drive/1bK6fpWfResjv9UxWoKHDStXQ8bop3a6Z?usp=sharing
cảm ơn bạn đã chia sẻ source code finetune, nhân tiện cho mình hỏi chút
Mình thấy Vintern-1b-v3.5 được finetune trên InternVL2.5-1b, tuy nhiên trong google colab lại đang hướng dẫn finetune Vintern-1B-v2 base trên InternVL2. Không biết liệu mình có làm tương tự với Vintern-1b-3.5 giống như trong nội dung google colab không nhỉ? Mình cảm ơn bạn