PDF to Word – Để chuyển đổi thành công tài liệu PDF tiếng Việt

Cuối cùng thì tôi cũng viết bài này. Đây là lần thứ 2 tôi cài đặt cùng lúc 5 phần mềm chuyển đổi từ PDF sang các định dạng Word, html, text, image, swf để thử nghiệm.

Lần trước đã thất bại thảm hại khi không có phần mềm nào chuyển đổi thành công sang file word tiếng Việt cả ! Đó là lý do vì sao tôi chưa post lên blog sau khi hứa với một bạn nào đó. Hôm qua có một comment cho bài viết về phần mềm PDF to Word Converter nên tôi quyết định thử lại.

PDF to Word

Có thể nói tiếng Việt chính là thử thách thực sự cho các phần mềm dạng này. Bình thường, các tài liệu PDF tiếng Việt sau khi convert thì ra toàn là mã, hồi nãy thậm chí nó còn ra tiếng…Cam-pu-chia, Thái Lan hay Ả rập gì đó mới ghê chứ ! Tôi tin là rất nhiều người trong chúng ta đã và sẽ thất vọng sau khi dùng thử các phần mềm này để convert các tài liệu tiếng Việt. Và bạn có biết rằng 90% nguyên nhân thất bại không nằm ở phần mềm mà nằm ở Font chữ của hệ thống !

Theo tôi thì có 2 điều kiện để việc chuyển đổi diễn ra suôn sẽ :

– Phần mềm hỗ trợ Unicode.

– Máy bạn phải có font chữ được sử dụng trong tập tin PDF cần convert.

Cái khó nằm ở vấn đề font chữ vì hiện nay vẫn còn nhiều nơi sử dụng bảng mã VNI hay TCVN3(ABC) để gõ tài liệu. Và tôi nhận thấy rằng rất ít tài liệu PDF trên mạng sử dụng font Unicode ! “Vì sao thế ?” – “Mọi chi tiết vui lòng liên hệ với…Chúa !”.

Có thể do tôi tải về các tài liệu “quý hiếm” nên mới ra nông nỗi này, tôi cũng không biết nữa, chỉ biết rằng convert 10 file thì hết 9 file thất bại.

Cách đây 30 phút, tôi quyết định cài đặt cho máy 2 bộ font chữ tiếng Việt phổ biến là VNI và ABC. Sau khi cài đặt thì mọi thứ đều tốt, phần mềm nào cũng convert được hết ! Khác biệt là ở chỗ, cùng một tài liệu PDF nhưng phần mềm A thì chuyển thẳng sang tiếng Việt trong khi phần mềm B thì bạn phải chỉnh lại font chữ trong file doc thì mới hiển thị đúng tiếng Việt.

Bài viết này tôi sẽ cung cấp cho bạn 2 bộ font chữ VNI và ABC cùng với phần mềm PDFtoWord v1.0 bản quyền do GAOTD tặng. Phần mềm này có giao diện và tính năng ít hơn các phần mềm khác nhưng do khả năng của nó xem ra cũng tốt nên tôi giới thiệu trước, các phần mềm còn lại sẽ giới thiệu sau vì giờ buồn ngủ quá rồi, có lẽ mai lên công ty vừa gặm bánh mì vừa viết tiếp vậy, hehe.

Một lý do nữa là PDF to Word giúp tôi chuyển thẳng một file PDF sang tiếng Việt có dấu mà không cần chỉnh lại font.

Bạn tải về phần mềm và 2 bộ font ở địa chỉ sau :

– PDF to Word : http://www.mediafire.com/?xyddtxijmgj

– VNI : http://www.mediafire.com/?wlq0f2mz2mm

– ABC (đã cập nhật lại link) : http://www.mediafire.com/?on2dzzorwjn

Cách cài font :

– Với font VNI : bạn tải file cài đặt về, giải nén và chép toàn bộ vào thư mục “WindowsFonts”

– Với font ABC : bạn giải nén sẽ thấy trong đó có 4 file nén khác là abc211.zip, abc212.zip, abc213.zip, abc214.zip -> giải nén những file này thành các thư mục tương ứng. Sau đó bạn vào thư mục abc211 và chạy file Setup, trong quá trình chạy nó sẽ hiện ra một hộp thoại, bạn hãy chỉ định đường dẫn đến thư mục abc212 sau đó là abc213 và cuối cùng là abc214 -> kết thúc quá trình cài đặt.

[Cập nhật]: Tôi đã cập nhật lại font ABC do nó khá là rắc rối khi cài đặt và việc cài đặt là không cần thiết. Giờ bạn chỉ việc tải về 2 link bên trên (đã cập nhật lại link của font ABC). Giải nén và chép hết vào thư mục “WindowsFonts” là được. Nhân tiện cám ơn bạn JC về comment gợi ý thêm một cách nữa.

Có thể bạn cần phải khởi động lại máy để cập nhật font mới.

Cách sử dụng PDFtoWord :

Đơn giản là bạn chỉ việc khởi động chương trình, chọn file PDF cần convert ở mục “Source PDF file” và chỉ định đường dẫn lưu file Doc ở “Destination folder > bấm Start convertion là xong.

Sau khi convert nếu mở ra bị lỗi bạn hãy thử đổi sang font Vni (bắt đầu bằng “VNI-“) hoặc font ABC (bắt đầu bằng “.VN”).

PDF to Word

Cuối cùng, tôi cũng không dám bảo đảm là nó sẽ thành công với trường hợp của bạn, vậy xin chúc các hàng xóm may mắn !

9 Comments
  1. Đúng là bực mình với các tài liệu font VNI thật.

  2. sao kì za pro. lúc cài đặt font ABC chọn thư mục abc112 thì ok nhưng tới abc113 thì nó k chịu! bắt pải cài ổ đỉa khác chứ ổ đỉa này k fu hợp.mình copy toàn bộ thư mục trên ổ D va cài trên đó lun..giúp mình nha anhhangxom tốt bụng…thanks

  3. bạn có thử cái toolkit của unikey dùng để đảo bảng mã chưa.Khi bạn convert tiếng việt ra những kí tự như trên ở file W bạn có thể copy vào clipboard và chuyển bảng mã từ TCVN sang Unicode đó là cách làm mình hay làm để conver từ PDF2W và sang các định dạng khác như PRC để đọc trên điện thoại,và fần lớn mình convert không gặp vấn đề gì chỉ có vấn đề khi PDF là dạng Image chứ khôg fải dạng text,có nhiều fần mềm PDF2W hỗ trợ tốt chuyển Image nhưng chỉ đc TA chứ TV chưa đc chuẩn.Đó là 1 vấn đề cũng hơi nan giải.

  4. To mrsumbk06 : tôi đã cập nhật lại font ABC rồi, giờ bạn chỉ việc tải về, giải nén và chép hết vào thư mục “WindowsFonts” là được, không cần cài đặt làm gì.

    To JC : Cám ơn gợi ý của bạn. Tôi cũng đã dùng cách này nhiều lần vì một số tài liệu tiếng Việt bị lỗi font nhưng không thành công. Có lẽ do tôi không xác định được font gốc của tài liệu, mà sử dụng tính năng Auto detect lại không được. Dù sao thì đây cũng là một cách mọi người nên thử vì ít nhất nó cũng thành công với bạn.

  5. mjnh cung thay hoi bat tien

  6. […] có thể xem bài viết “PDF to Word : Để chuyển đổi thành công tài liệu PDF tiếng Việt sang Word” , hy vọng nó giúp bạn chuyển đổi thành […]

  7. Cái chương trình đó file pdf mà lớn 1 tí là ko thèm convert lun.

  8. Mình xin giới thiệu các hàng xóm 1 phần mềm chuyển pdf sang word rất hay là Solid pdf converter 6.Phần mềm này chuyển pdf sang word hầu như không bị lỗi font.Nó có thể chuyển pdf sang excel, ppt hoặc html , image nữa.

  9. Mình cũng xài Solid Converter, lỗi như thường, đang tính đổi phần mềm để khỏi bị lỗi đây mà không biết cài cái nào hay. Các huynh giúp mình với.

Gửi phản hồi