XML-logo

XML คืออะไร

Extensible Markup Language หรือ XML คืออะไร ? ภาษาของ computer ที่ใช้งานสำหรับการกำหนดรูปแบบการเข้ารหัสของข้อมูลใน format ของทั้งที่มนุษย์อ่านและ computer อ่านได้ โดยมี specification คือ W3C XML 1.0

เป้าหมายของการใช้ XML คืออะไร ? ก็เพื่อ ความสะดวก, เป็นกลาง และ สามารถใช้งานบน internet ในลักษณะของข้อมูล text ที่รองรับ Unicode ได้รับหรับทุกภาษาของคนเรา ส่วนมากถูกใช้งานกับ Web service เพื่อให้ทาง programmer สามารถเขียน application programming interfaces (APIs) เพื่อสือสารกับ application ภายนอก

 

โครงสร้างของ XML

<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>

สำหรับโครงสร้างของ XML ที่จะอธิบายต่อไปนี้ อาจจะไม่เหมือนกับที่เจออยู่ปัจจุบัน เป็นเพียงแค่ส่วนมากที่ใช้งานอยู่

ตัวอักษร

XML document จะใช้ string ในการเขียน ซึ่งส่วนมักจะอยู่ในฐานของ Unicode

การแปลงข้อมูล

ส่วนที่ทำการแปลงข้อมูล จะทำการวิเคราะห์ markup  และทำการส่งโครงสร้างข้อมูล ไปยัง application เรามักเรียกว่า XML parser

เนื่อหาข้อมูล

หลังจากที่ตัวอักษรทั้งหมดใน XML document ได้ถูกแบ่งออกตามจากการแปลงตามโครงสร้างข้อมูล โดยปกติข้อมูล markup จะขึ้นต้นด้วย “<” และจบด้วย “>” หรืออาจจะขึ้นต้นด้วย “&” และจบด้วย “;’ ส่วนที่เหลือเราจะเรียกว่า content แต่อย่างไรก็ตาม ส่วนของ “CDATA” เช่น <![CDATA[ and ]]> ก็นับเป็น markup อย่างหนึ่ง ส่วน text ระหว่างนั้นคือ content เช่นกัน ส่วนช่องไฟก่อนและหลังภายนอก markup ถือเป็น markup

Tag

Tag เป็น โครงสร้างของ markup เอง เช่น <…> มีด้วยกัน 3 แบบ

  • start-tag เช่น <section>;
  • end-tag เช่น </section>;
  • empty-tag เช่น <line-break />;

Element

Element คือส่วนตั้งแต่เริ่ม start-tag จนถึง end-tag ส่วน แต่สำหรับ Element content จะเป็นข้อมูลที่อยู่ภายในระหว่าง start-tag จนถึง end-tag เช่น <greeting>Hello, world!</greeting>

Attribute

Attribute คือ ข้อมูลภายใน markup มีลักษณะเป็นคู่ name-value ตัวอย่างเช่น <img src=”madonna.jpg” alt=”Madonna” /> name คือ “src” และ “alt” และ value คือ “madonna.jpg” และ “Madonna” ทั้งหมดเรียกว่า attribute (name-value) โดย XML attribute สามารถมีได้ 1 value ของแต่ละ attribute ที่ปรากฎ

XML declaration

XML document จะเริ่มต้นด้วย XML declaration เพื่อบอกข้อมูลของตัวมันเองเช่น <?xml version="1.0" encoding="UTF-8"?>

 

XML tag

 

สัญลักษณ์ XML escape character

  • “<” และ “&” เป็น marker
  • ตัวอักษรบางตัวรองรับได้เฉพาะ Unicode เช่น “é”
  • ตัวอักษรบางตัวไม่สามารถแยกแยะกับตัวอักษรตัวอื่นได้ เช่น  non-breaking space (&#xa0;) ” ” กับ space (&#x20;) ” ” หรือ  Cyrillic capital letter A (&#x410;) “А” กับ the Latin capital letter A (&#x41;) “A”

รวมถึง predefind ตามนี้

  • &lt; คือ “<“;
  • &gt; คือ “>”;
  • &amp; คือ “&”;
  • &apos; คือ “'“;
  • &quot; คือ ‘"‘.

 

การ comment XML

สำหรับ comment สามารถใส่ตรงไหนก็ได้ใน XML document แต่ต้องอยู่ภายนอก markup โดย comment ทั้งหมดจะไม่ถูกนำไปแปลงค่า ซึ่ง XML Comment จะเริ่มต้นด้วย <!  และจบด้วย –> โดยมีตัวอักษรภายใน comment ที่ยกเว้นห้ามใช้คือ “–” (double-hyphen) และสำหรับ ampersand (&) ไม่มีผลภายใน comment

ตัวอย่าง comment ที่ถูกต้องคือ <!–no need to escape <code> & such in comments–>

 

 

Author: Suphakit Annoppornchai

Credit: https://saixiii.com, https://en.wikipedia.org

7 Thoughts to “XML คืออะไร XML คือ ภาษาที่กำหนดกฎของรูปแบบข้อมูล เช่น HTML”

  1. […] machine-to-machine ในรูปแบบ XML และ JSON format นั้นคือคำตอบว่า Web service […]

  2. […] HTTP และขยายออกไปสู่รูปแบบ XML และ JSON ซึ่งโดนรวมแล้วก็คืออยู่บน web […]

  3. […] format มาตราฐานเช่น XML,YAML,JSON หรือ binary และเก็บไว้ใน database ด้วย unique […]

  4. […] Language หรือ WSDL คือ เอกสารข้อมูลในรูปแบบ XML ใช้ในการบอกหน้าที่การทำงานของ web […]

  5. […] Discovery, and Integration หรือ UDDI คือ ศูนย์รวมข้อมูล XML สำหรับโลกธรุกิจบน internet […]

Leave a Reply