Free-OCR : ứng dụng web nhận dạng Tiếng Việt xuất sắc

Free-OCR : ứng dụng web nhận dạng Tiếng Việt xuất sắcNói xuất sắc thì hơi chém gió một chút nhưng Free-ORC là ứng dụng nhận dạng Tiếng Việt miễn phí tốt nhất ở thời điểm hiện tại mà tôi biết. Vấn đề nhận dạng và xuất text (tiếng Anh) từ hình ảnh là chuyện “xưa rồi diễm” nhưng nhận dạng được Tiếng Việt thì là cả một vấn đề. Bữa trước có một công ty là nhà phân phối thiết bị của Kodak, có qua demo cho mình xem phần mềm nhận dạng Tiếng Việt của họ tự viết, nhìn chung là khá ổn nhưng phần mềm đó bán với giá khoảng 4 triệu, kèm theo nhiều tính năng khác. Cũng đúng, phần mềm nhận dạng được Tiếng Việt từ hình ảnh không lý nào lại miễn phí :))

Nhưng Free-ORC thì lại khác. Có thể nó không được hoàn thiện và nhận dạng được 100% nhưng theo những gì nó làm được quả thật là đáng nể. Nó sẽ giúp bạn tiết kiệm được rất nhiều thời gian.

Tôi ví dụ đây là tấm hình chứa đoạn text Tiếng Việt :

Free-OCR : ứng dụng web nhận dạng Tiếng Việt xuất sắc

Còn đây là kết quả trả về của Free-ORC :

Cùng làm toán với anhhangxom(^o^)nIine nào. Hãy gõ vào ô bên dưới câu trá
lời cho câu hói “Một với ba là máy IJ”. Bạn gõ bằng tiê’ng Việt không dấu nhé
[ví dụ : hai, sau, muoi ba, nam muoi bay…v…v…] Do blog bị spam quá nhều
gây ánh hưởng tới tốc độ truy cập nên tôi đành phải sử dụng cách này, mong
các bạn thông cámỆãÐ

Tôi chỉ phải sửa lại vài chữ mà thôi :*

Cách sử dụng như sau :

– Truy cập vào trang chủ : http://www.free-ocr.com/

Free-OCR : ứng dụng web nhận dạng Tiếng Việt xuất sắc

– Phần Language chọn ngôn ngữ cần chuyển là “Vietnamese”.

– Bấm nút “Choose file” để chọn file hình ảnh cần chuyển. Dung lượng file tối đa là 2MB. Chấp nhận các định dạng JPG, GIF, TIFF, BMP và cả định dạng PDF !

– Nhập vào mã xác thực và bấm nút. Đợi một lát là bạn sẽ thấy kết quả hiện ra.

Ứng dụng web này hỗ trợ rất nhiều ngôn ngữ : Anh, Pháp, Đức, Tây Ban Nha, Thổ Nhĩ Kì, Ý, Indonesia, Balan, Thụy Điển, Đan Mạch, Bulgari…v..v…