XML CDATA

ข้อความทั้งหมดในเอกสาร XML จะถูกแยกจากตัวแยกวิเคราะห์ที่

เพียง CDATA ส่วนข้อความจะถูกละเลยโดยตัวแยกวิเคราะห์ที่

PCDATA - แยกวิเคราะห์ข้อมูลตัวอักษร

parsers XML ปกติแยกข้อความทั้งหมดในเอกสาร XML

เมื่อองค์ประกอบ XML จะแยกข้อความระหว่างแท็กก็จะได้รับการแก้ไข:

<message> This text is also parsed </message>

Parser ทำเช่นนี้เพราะองค์ประกอบ XML สามารถมีองค์ประกอบอื่น ๆ เช่นในกรณีนี้ที่ <ชื่อ> องค์ประกอบที่มีสององค์ประกอบอื่น ๆ (แรกและครั้งสุดท้าย):

<name><first>Bill</first><last>Gates</last></name>

ตัวแยกวิเคราะห์จะทำลายมันลงเป็นองค์ประกอบย่อยเช่นนี้

<name>
<first>Bill</first>
<last>Gates</last>
</name>

แจงข้อมูลตัวอักษร (PCDATA) เป็นคำที่ใช้ในข้อมูลข้อความในตัวแยกวิเคราะห์ของ XML

CDATA ระยะคือข้อมูลที่เป็นข้อความไม่ควรแยกวิเคราะห์โดยแยกวิเคราะห์ของ XML

เช่น "<" และ "&" ตัวละครในองค์ประกอบ XML เป็นสิ่งผิดกฎหมาย

"<" จะสร้างข้อผิดพลาดเนื่องจาก parser จะตีความตัวละครตัวนี้เป็นจุดเริ่มต้นขององค์ประกอบใหม่

"&" จะสร้างข้อผิดพลาดเนื่องจาก parser จะตีความตัวละครที่เป็นหน่วยงานที่ตัวละครเริ่มต้น

ข้อความบางอย่างเช่นรหัส JavaScript, มีจำนวนมากของ "<" หรือตัวอักษร "และเป็น" เพื่อหลีกเลี่ยงข้อผิดพลาดรหัสสคริปต์สามารถกำหนดเป็น CDATA

ส่วน CDATA เนื้อหาทั้งหมดจะถูกปฏิเสธโดยตัวแยกวิเคราะห์ที่

CDATA ส่วนหนึ่งโดย"<! [CDATA [" เริ่มต้นด้วยการ "]]>"End:

ในตัวอย่างข้างต้น, ตัวแยกวิเคราะห์ที่จะไม่สนใจส่วน CDATA เนื้อหาทั้งหมด

หมายเหตุเกี่ยวกับส่วน CDATA:

CDATA ส่วนไม่สามารถมีสตริง "]]>." มันไม่ได้ช่วยให้ส่วน CDATA ซ้อนกัน

จุดสิ้นสุดของส่วน CDATA ได้. "]]>" ไม่สามารถมีช่องว่างหรือแบ่งบรรทัด