XML CDATA
ข้อความทั้งหมดในเอกสาร XML จะถูกแยกจากตัวแยกวิเคราะห์ที่
เพียง CDATA ส่วนข้อความจะถูกละเลยโดยตัวแยกวิเคราะห์ที่
PCDATA - แยกวิเคราะห์ข้อมูลตัวอักษร
parsers XML ปกติแยกข้อความทั้งหมดในเอกสาร XML
เมื่อองค์ประกอบ XML จะแยกข้อความระหว่างแท็กก็จะได้รับการแก้ไข:
Parser ทำเช่นนี้เพราะองค์ประกอบ XML สามารถมีองค์ประกอบอื่น ๆ เช่นในกรณีนี้ที่ <ชื่อ> องค์ประกอบที่มีสององค์ประกอบอื่น ๆ (แรกและครั้งสุดท้าย):
ตัวแยกวิเคราะห์จะทำลายมันลงเป็นองค์ประกอบย่อยเช่นนี้
<first>Bill</first>
<last>Gates</last>
</name>
แจงข้อมูลตัวอักษร (PCDATA) เป็นคำที่ใช้ในข้อมูลข้อความในตัวแยกวิเคราะห์ของ XML
CDATA - (ยังไม่ได้แก้ไข) ข้อมูลตัวอักษร
CDATA ระยะคือข้อมูลที่เป็นข้อความไม่ควรแยกวิเคราะห์โดยแยกวิเคราะห์ของ XML
เช่น "<" และ "&" ตัวละครในองค์ประกอบ XML เป็นสิ่งผิดกฎหมาย
"<" จะสร้างข้อผิดพลาดเนื่องจาก parser จะตีความตัวละครตัวนี้เป็นจุดเริ่มต้นขององค์ประกอบใหม่
"&" จะสร้างข้อผิดพลาดเนื่องจาก parser จะตีความตัวละครที่เป็นหน่วยงานที่ตัวละครเริ่มต้น
ข้อความบางอย่างเช่นรหัส JavaScript, มีจำนวนมากของ "<" หรือตัวอักษร "และเป็น" เพื่อหลีกเลี่ยงข้อผิดพลาดรหัสสคริปต์สามารถกำหนดเป็น CDATA
ส่วน CDATA เนื้อหาทั้งหมดจะถูกปฏิเสธโดยตัวแยกวิเคราะห์ที่
CDATA ส่วนหนึ่งโดย"<! [CDATA [" เริ่มต้นด้วยการ "]]>"End:
<![CDATA[
function matchwo(a,b)
{
if (a < b && a < 0) then
{
return 1;
}
else
{
return 0;
}
}
]]>
</script>
ในตัวอย่างข้างต้น, ตัวแยกวิเคราะห์ที่จะไม่สนใจส่วน CDATA เนื้อหาทั้งหมด
หมายเหตุเกี่ยวกับส่วน CDATA:
CDATA ส่วนไม่สามารถมีสตริง "]]>." มันไม่ได้ช่วยให้ส่วน CDATA ซ้อนกัน
จุดสิ้นสุดของส่วน CDATA ได้. "]]>" ไม่สามารถมีช่องว่างหรือแบ่งบรรทัด