Belajar PHP: Menghapus Tag HTML dari Microsoft Word

Jika anda termasuk yang menggunakan editor berbasis JQuery seperti TinyMCE, nicEdit dkk, anda tentu akan kesal jika hasil tulisan yang diharapkan menjadi rusak tidak karuan karena klien anda langsung mengcopy dan mempaste tulisan dari Microsoft Word.

Microsoft Word sejak versi 2007 menggunakan layout dokumen berbasis markup language, sehingga jika langsung ditaruh dalam editor, akan merusak tag HTML untuk tulisan itu. Berikut solusi yang anda bisa terapkan.

function cleanHTML($html) {
$html = ereg_replace("<(/)?(font|span|del|ins)[^>]*>","",$html);

$html = ereg_replace("<([^>]*)(class|lang|style|size|face)=("[^"]*"|'[^']*'|[^>]+)([^>]*)>","<\1>",$html);
$html = ereg_replace("<([^>]*)(class|lang|style|size|face)=("[^"]*"|'[^']*'|[^>]+)([^>]*)>","<\1>",$html);

return $html
}

Script diatas akan menghapus beberapa tag yang umum ada di Microsot Word (namun belum semuanya).

Wagiman Wiryosukiro

Petani Sistem Informasi, tukang las plugin & themes Wordpress. Co-Founder SistemInformasi.biz. Saat ini aktif sebagai Developer & kontributor di OpenMandriva Linux.

You may also like...

2 Responses

  1. Mahfud says:

    wah, baru ngerti aq yang ginian.. coba dulu ah..

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.

%d bloggers like this: