Skip to main content

01/12 Report

Created on November 16|Last edited on December 2
Sau khi gặp một vài vấn đề liên quan đến dữ liệu, em đã lấy mẫu khoảng 30 ảnh trong folder Docx Images gồm những phương trình được trích xuất từ MS Word và lưu ở dạng ảnh.
Dữ liệu được lưu trong link drive này.
Với từng folder data, kết quả predict được lưu trong file csv tương ứng theo số thứ tự.

Đây là một số hình ảnh được plot ra để so sảnh điểm khác biệt giữa các ảnh với nhau
Ảnh ở hàng đầu: ảnh gốc từ folder Docx_Images của anh Hoà
Ảnh ở hàng thứ 2: ảnh được generate từ KaTeX
Ảnh ở hàng thứ 3: ảnh gốc được resize về cùng kích cỡ với ảnh được tạo từ KaTeX
Ảnh 1



Ảnh 11



Ảnh 15



Ảnh 17

Kết quả Predict được thể hiện ở file Excel như sau:

Đối với folder 1 (dữ liệu gốc của anh Hoà):
Kết quả predict trên dữ liệu gốc của anh Hoà lấy từ folder Docx Images sai toàn bộ cho các trường hợp

Đối với folder 2 (dữ liệu được tạo ra từ KaTeX):
Kết quả predict vẫn sai cho toàn bộ các trường hợp, tuy nhiên lại thiên về hướng generate toàn bộ phương trình từ model chứ không phân biệt ký tự, toán tử ,...

Đối với folder 3 (Ảnh từ folder 1 được resize trùng với kích thước ảnh của folder 2):

Predicted


Ground Truth

Ở đây có thể thấy đối với data ở folder 3, model bị confusing rất rõ với ảnh được resize kéo theo các phương trình trong đây bị kéo giãn một cách rõ rệt.