Skip to content

emka.web.id

menulis pengetahuan – merekam peradaban

Menu
  • Home
  • Tutorial
  • Search
Menu

Belajar PHP: Mengantisipasi Tag HTML Yang Tak Tertutup Sempurna

Posted on June 4, 2012

Pada tutorial kali ini kita akan membahas tentang cara mengantisipasi konten web yang berisi tag-tag HTML yang tak sempurna. Maksud dari tak sempurna ini misalnya kesalahan tulis sehingga tag ditulis double, belum ditulisnya tag penutup atau kesalahan lain karena terpotong (misal pada kasus split ‘read more’).

Contoh tag yang tidak sempurna misalnya:
[sourcecode language=”html”]
<script>

atau

<<strong>>

[/sourcecode]

Untuk mengantisipasi masalah ini, kita bisa contoh apa yang dilakukan oleh WordPress dengan fungsi force_balance_tags().

[sourcecode language=”php”]
/**
* Balances tags of string using a modified stack.
*
* @since 2.0.4
*
* @author Leonard Lin <leonard@acm.org>
* @license GPL
* @copyright November 4, 2001
* @version 1.1
* @todo Make better – change loop condition to $text in 1.2
* @internal Modified by Scott Reilly (coffee2code) 02 Aug 2004
* 1.1 Fixed handling of append/stack pop order of end text
* Added Cleaning Hooks
* 1.0 First Version
*
* @param string $text Text to be balanced.
* @return string Balanced text.
*/
function force_balance_tags( $text ) {
$tagstack = array();
$stacksize = 0;
$tagqueue = ”;
$newtext = ”;
$single_tags = array( ‘br’, ‘hr’, ‘img’, ‘input’ ); // Known single-entity/self-closing tags
$nestable_tags = array( ‘blockquote’, ‘div’, ‘span’, ‘q’ ); // Tags that can be immediately nested within themselves

// WP bug fix for comments – in case you REALLY meant to type ‘< !–‘
$text = str_replace(‘< !–‘, ‘< !–‘, $text);
// WP bug fix for LOVE <3 (and other situations with ‘<‘ before a number)
$text = preg_replace(‘#<([0-9]{1})#’, ‘&lt;$1’, $text);

while ( preg_match("/<(\/?[\w:]*)\s*([^>]*)>/", $text, $regex) ) {
$newtext .= $tagqueue;

$i = strpos($text, $regex[0]);
$l = strlen($regex[0]);

// clear the shifter
$tagqueue = ”;
// Pop or Push
if ( isset($regex[1][0]) && ‘/’ == $regex[1][0] ) { // End Tag
$tag = strtolower(substr($regex[1],1));
// if too many closing tags
if( $stacksize <= 0 ) {
$tag = ”;
// or close to be safe $tag = ‘/’ . $tag;
}
// if stacktop value = tag close value then pop
else if ( $tagstack[$stacksize – 1] == $tag ) { // found closing tag
$tag = ‘</’ . $tag . ‘>’; // Close Tag
// Pop
array_pop( $tagstack );
$stacksize–;
} else { // closing tag not at top, search for it
for ( $j = $stacksize-1; $j >= 0; $j– ) {
if ( $tagstack[$j] == $tag ) {
// add tag to tagqueue
for ( $k = $stacksize-1; $k >= $j; $k–) {
$tagqueue .= ‘</’ . array_pop( $tagstack ) . ‘>’;
$stacksize–;
}
break;
}
}
$tag = ”;
}
} else { // Begin Tag
$tag = strtolower($regex[1]);

// Tag Cleaning

// If self-closing or ”, don’t do anything.
if ( substr($regex[2],-1) == ‘/’ || $tag == ” ) {
// do nothing
}
// ElseIf it’s a known single-entity tag but it doesn’t close itself, do so
elseif ( in_array($tag, $single_tags) ) {
$regex[2] .= ‘/’;
} else { // Push the tag onto the stack
// If the top of the stack is the same as the tag we want to push, close previous tag
if ( $stacksize > 0 && !in_array($tag, $nestable_tags) && $tagstack[$stacksize – 1] == $tag ) {
$tagqueue = ‘</’ . array_pop ($tagstack) . ‘>’;
$stacksize–;
}
$stacksize = array_push ($tagstack, $tag);
}

// Attributes
$attributes = $regex[2];
if( !empty($attributes) )
$attributes = ‘ ‘.$attributes;

$tag = ‘<‘ . $tag . $attributes . ‘>’;
//If already queuing a close tag, then put this tag on, too
if ( !empty($tagqueue) ) {
$tagqueue .= $tag;
$tag = ”;
}
}
$newtext .= substr($text, 0, $i) . $tag;
$text = substr($text, $i + $l);
}

// Clear Tag Queue
$newtext .= $tagqueue;

// Add Remaining text
$newtext .= $text;

// Empty Stack
while( $x = array_pop($tagstack) )
$newtext .= ‘</’ . $x . ‘>’; // Add remaining tags to close

// WP fix for the bug with HTML comments
$newtext = str_replace("< !–","<!–",$newtext);
$newtext = str_replace("< !–","< !–",$newtext);

return $newtext;
}
[/sourcecode]

Penggunaannya sederhana, tinggal panggil fungsi force_balance_tags() dengan argumen teks yang akan difilter. Hal ini sangat berguna misalnya saat menampilkan konten berita dengan tag HTML yang displit seperti fitur ‘read more’ milik WordPress. Semoga berguna.

Terbaru

  • Caranya Ngebangun Website Directory dengan Traffic Tinggi dalam Seminggu!
  • Cara Mengembangkan Channel YouTube Shorts Tanpa Wajah
  • Inilah Cara Menghitung Diskon Baju Lebaran Biar Nggak Bingung Saat Belanja di Mall!
  • Cara Jitu Ngebangun Bisnis SaaS di Era AI Pakai Strategi Agentic Workflow
  • Inilah Rincian Gaji Polri Lulusan Baru 2026, Cek Perbedaan Jalur Akpol, Bintara, dan Tamtama Sebelum Daftar!
  • Inilah 5 Channel YouTube Membosankan yang Diam-diam Menghasilkan Banyak Uang
  • Inilah Cara Pakai Google Maps Offline Biar Mudik Lebaran 2026 Nggak Nyasar Meski Tanpa Sinyal!
  • Inilah Alasan Mahkamah Agung Tolak Kasasi Google, Denda Rp202,5 Miliar Resmi Menanti Akibat Praktik Monopoli
  • Inilah Cara Daftar dan Syarat SPMB SMK Boarding Jawa Tengah 2026, Sekolah Gratis Sampai Lulus!
  • Inilah Daftar Sekolah Kedinasan 2026 untuk Lulusan SMK, Bisa Kuliah Gratis dan Berpeluang Besar Langsung Jadi CPNS!
  • Inilah Pajak TER: Skema Baru PPh 21 yang Nggak Bikin Pusing, Begini Cara Hitungnya!
  • Inilah Jadwal Resmi Jam Buka Tol Jogja-Solo Segmen Prambanan-Purwomartani Saat Mudik Lebaran 2026
  • Inilah Cara Mendapatkan Witherbloom di Fisch Roblox, Rahasia Menangkap Ikan Paling Sulit di Toxic Grove!
  • Kenapa Indomart Point Bisa Kalahkan Bisnis Kafe?
  • Inilah Cara Mendapatkan Rotten Seed di Fisch Roblox, Lokasi Rahasia di Toxic Grove Buat Unlock Toxic Lotus!
  • Inilah Cara Zakat Crypto Kalian Bisa Jadi Pengurang Pajak Berdasarkan Aturan Resmi Pemerintah!
  • Inilah Perbandingan Airwallex vs Payoneer 2026: Jangan Sampai Profit Kalian Ludes Gara-Gara Biaya Admin!
  • Inilah Roadmap 7 Tahap Bangun Bisnis Digital dari Nol Biar Nggak Cuma Putar-Putar di Tempat!
  • Inilah Cara Tetap Gajian dari YouTube Meski View Masih Ratusan, Penasaran?
  • Inilah Alasan Akun TikTok Affiliate GMV 270 Juta Kena Banned Permanen!
  • Inilah Bahaya Astute Beta Server APK, Jangan Sembarang Klik Link Download FF Kipas 2026!
  • Inilah Bahaya Nonton Film di LK21 dan IndoXXI, Awas Data Pribadi dan Saldo Rekening Kalian Bisa Ludes!
  • Inilah Kronologi & Video Lengkap Kasus Sejoli Tambelangan Sampang Viral, Ternyata Gini Awal Mulanya!
  • Inilah Alasan Kenapa Koin Nego Neko Shopee Nggak Bisa Dipakai Bayar Full dan Cara Rahasia Dapetinnya!
  • Inilah Cara Menjawab Pertanyaan Apakah di Sekolahmu Sudah Ada IFP/PID dengan Benar dan Profesional
  • Inilah Fakta Isu Roblox Diblokir di Indonesia 2026, Benarkah Akan Ditutup Total?
  • Inilah Penyebab dan Cara Mengatasi FF Kipas My ID Verify UID Biar Akun Tetap Aman
  • Inilah Deretan HP RAM 8GB Harga di Bawah 2 Juta Terbaik 2026, Spek Dewa Tapi Nggak Bikin Kantong Jebol!
  • Contoh Cara Buat SK Panitia TKA 2026
  • Inilah Cara Download Point Blank ID Versi Terbaru 2026, Gampang Banget Ternyata!
  • Why Does PowerPoint Underline Hyperlinks? Here is How to Remove Them
  • AI Bug Hunting with Semgrep
  • What is the Excel Power Query 0xc000026f Error?
  • How to Build Your Own Homelab AI Supercomputer 2026
  • How to Enable SSH in Oracle VirtualBox for Beginners
  • 6 Innovative AI Tools for 2026: From Voice Cloning to Advanced Automation Systems
  • How to Run Hunter Alpha: The Free 1 Trillion Parameter AI Agent on OpenClaw
  • Build Your Own Self-Improving AI: A Guide to Andrej Karpathy’s Autoresearch and Claude Code
  • Build DIY AI Assistant with Copilot SDK
  • How to Automate Your Daily Routine Using OpenClaw + Claude Code Desktop’s New Scheduled Tasks and Loop Features
  • Apa itu Spear-Phishing via npm? Ini Pengertian dan Cara Kerjanya yang Makin Licin
  • Apa Itu Predator Spyware? Ini Pengertian dan Kontroversi Penghapusan Sanksinya
  • Mengenal Apa itu TONESHELL: Backdoor Berbahaya dari Kelompok Mustang Panda
  • Siapa itu Kelompok Hacker Silver Fox?
  • Apa itu CVE-2025-52691 SmarterMail? Celah Keamanan Paling Berbahaya Tahun 2025

©2026 emka.web.id | Design: Newspaperly WordPress Theme