Chương này trình bày cho bạn các qui tắc cú pháp đơn giản để viết một tài liệu XML. Ví dụ dưới là một tài liệu XML đầy đủ:
<?xml version="1.0"?>
<contact-info>
<name>Tanmay Patil</name>
<company>TutorialsPoint</company>
<phone>(011) 123-4567</phone>
</contact-info>
Bạn để ý trong ví dụ trên có hai loại thông tin:
Sơ đồ sau minh họa qui tắc cú pháp để viết các kiểu đánh dấu và text khác nhau trong một tài liệu XML.
Chúng ta đi vào giải thích chi tiết cho từng phần:
Tài liệu XML có thể tùy ý có một phần khai báo XML. Nó được viết như sau:
<?xml version="1.0" encoding="UTF-8"?>
Ở đây, version là phiên bản XML và encoding xác định mã hóa ký tự được sử dụng trong tài liệu.
Một XML file được cấu thành bởi một số phần tử XML (Element), còn được gọi là XML-node hoặc XML-tags. Tên các phần tử XML được bao trong các dấu < > như sau:
<element>
Cú pháp phần tử: Mỗi phần tử XML cần được bao trong hoặc với phần tử bắt đầu hoặc kết thúc như sau:
<element>....</element>
Hoặc đơn giản theo cách:
<element/>
Lồng các phần tử: Một phần tử XML có thể chứa nhiều phần tử XML khác như là con của nó, nhưng các phần tử con này phải không đè lên nhau, ví dụ: Một thẻ đóng của một phần tử phải có cùng tên như thẻ mở kết nối với nó.
Ví dụ sau minh họa các thẻ lồng nhau sai cú pháp:
<?xml version="1.0"?>
<contact-info>
<company>TutorialsPoint
<contact-info>
</company>
Ví dụ sau minh họa các thẻ lồng nhau đúng cú pháp:
<?xml version="1.0"?>
<contact-info>
<company>TutorialsPoint</company>
<contact-info>
Phần tử gốc (Root Element): Một tài liệu XML có thể chỉ có một phần tử gốc. Ví dụ sau minh họa một tài liệu XML sai cú pháp, bởi vì cả hai phần tử x và y xuất hiện ở cấp cao nhất mà không phải là một phần tử gốc.
<x>...</x>
<y>...</y>
Còn đây là ví dụ về đúng cú pháp:
<root>
<x>...</x>
<y>...</y>
</root>
Phân biệt kiểu chữ: Tên của các phần tử XML là phân biệt kiểu chữ. Nghĩa là tên của thẻ mở và thẻ đóng phải cùng kiểu.
Ví dụ,
Một thuộc tính xác định thuộc tính cho phần tử, sử dụng một cặp tên/giá trị. Một phần tử XML có thể có một hoặc nhiều thuộc tính. Ví dụ:
<a href="http://www.tutorialspoint.com/">Tutorialspoint!</a>
Ở đây href là tên thuộc tính và http://www.tutorialspoint.com/ là giá trị thuộc tính.
<a b="x" c="y" b="z">....</a>
Tên thuộc tính được định nghĩa không có sự trích dẫn, trong khi giá trị thuộc tính phải luôn luôn trong các dấu trích dẫn. Ví dụ sau là sai cú pháp:
<a b=x>....</a>
Trong ví dụ này, giá trị thuộc tính không được định nghĩa trong các dấu trích dẫn.
Tham chiếu (References) thường cho phép bạn thêm hoặc bao phần text hoặc phần đánh dấu bổ sung trong một tài liệu XML. Các tham chiếu luôn luôn bắt đầu với biểu tượng "&" , đây là ký tự dành riêng và kết thúc với ký tự ";". XML có hai kiểu tham chiếu:
Tham chiếu thực thể (Entity Reference): Một tham chiếu thực thể chứa một tên giữa dấu tách mở và dấu tách đóng. Ví dụ: & có amp là tên. Tên tham chiếu tới một chuỗi văn bản hoặc đánh dấu đã được định nghĩa trước.
Tham chiếu ký tự (Character Reference): Chứa các tham chiếu, ví dụ A, chứa một dấu băm (#) được theo sau bởi một số. Số này luôn luôn tham chiếu tới mã hóa Unicode của ký tự. Trong ví dụ này, 65 tham chiếu tới chữ cái "A".
Ký tự không được phép sử dụng | Thực thể thay thế | Miêu tả |
---|---|---|
< | < | Nhỏ hơn |
> | > | Lớn hơn |
& | & | Và |
' | ' | Dấu nháy đơn |
" | " | Trích dẫn kép |
Unpublished comment
Viết câu trả lời