HTML Karakter Set
Untuk menampilkan halaman HTML dengan benar, browser harus tahu apa karakter-set untuk digunakan.Karakter-set untuk dunia web yang luas awal adalah ASCII. ASCII mendukung angka dari 0-9, abjad Inggris huruf besar dan huruf kecil, dan beberapa karakter khusus.
Lengkapi referensi ASCII .
Karena banyak negara menggunakan karakter yang bukan merupakan bagian dari ASCII, default character-set untuk browser modern adalah ISO-8859-1.
Lengkap ISO-8859-1 referensi .
Jika halaman web menggunakan karakter yang berbeda-set dari IS
O-8859-1, harus ditentukan dalam tag <meta>.
Coba sendiri
Karakter ISO Set
Ini adalah Organisasi Standar Internasional (ISO) yang mendefinisikan standar karakter-set untuk abjad yang berbeda / bahasa.Para karakter yang berbeda-set yang digunakan di seluruh dunia tercantum di bawah ini:
Karakter set | Deskripsi | Meliputi |
---|---|---|
ISO-8859-1 | Abjad Latin bagian 1 | Amerika Utara, Eropa Barat, Amerika Latin, Karibia, Kanada, Afrika |
ISO-8859-2 | Abjad Latin bagian 2 | Eropa Timur |
ISO-8859-3 | Abjad Latin bagian 3 | SE Eropa, Esperanto, lain aneka |
ISO-8859-4 | Abjad Latin bagian 4 | Skandinavia / Baltik (dan lain-lain tidak dalam ISO-8859-1) |
ISO-8859-5 | Latin / Cyrillic bagian 5 | Bahasa yang menggunakan alfabet Cyrillic seperti Bulgaria, Belarusia, Rusia dan Macedonia |
ISO-8859-6 | Latin / Arab bagian 6 | Bahasa yang menggunakan huruf Arab |
ISO-8859-7 | Latin / Yunani bagian 7 | Bahasa Yunani modern serta simbol matematika berasal dari bahasa Yunani |
ISO-8859-8 | Latin / Ibrani bagian 8 | Bahasa yang menggunakan abjad Ibrani |
ISO-8859-9 | Latin 5 bagian 9 | Bahasa Turki. Sama seperti ISO-8859-1 karakter kecuali Turki yang menggantikan Islandia |
ISO-8859-10 | Latin 6 Lappish, Nordic, Eskimo | The Nordic bahasa |
ISO-8859-15 | Latin 9 (alias Latin 0) | Mirip dengan ISO 8859-1 tetapi menggantikan beberapa simbol yang kurang umum dengan tanda euro dan beberapa karakter lainnya hilang |
ISO-2022-JP | Latin / Jepang bagian 1 | Bahasa Jepang |
ISO-2022-JP-2 | Latin / Jepang bagian 2 | Bahasa Jepang |
ISO-2022-KR | Latin / Korean bagian 1 | Bahasa Korea |
The Standard Unicode
Karena karakter-set yang tercantum di atas terbatas dalam ukuran, dan tidak kompatibel di lingkungan multibahasa, Konsorsium Unicode mengembangkan standar Unicode.Standar Unicode mencakup semua karakter, punctuations, dan simbol di dunia.
Unicode memungkinkan pengolahan, penyimpanan dan pertukaran data teks tidak peduli apa platform, tidak peduli apa program, tidak peduli apa bahasa.
Konsorsium Unicode
Konsorsium Unicode mengembangkan standar Unicode. Tujuan mereka adalah untuk mengganti karakter yang ada-set dengan Format Transformasi standar Unicode (UTF).Standar Unicode telah menjadi sukses dan diimplementasikan dalam XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML, dll standar Unicode juga didukung dalam banyak sistem operasi dan semua browser modern.
Konsorsium Unicode bekerja sama dengan organisasi standar memimpin pengembangan, seperti ISO, W3C, dan ECMA.
Unicode dapat diterapkan oleh rangkaian karakter-berbeda. Pengkodean yang paling sering digunakan adalah UTF-8 dan UTF-16:
Karakter-set | Deskripsi |
---|---|
UTF-8 | Sebuah karakter dalam UTF8 dapat dari 1 sampai 4 byte panjang. UTF-8 bisa mewakili setiap karakter dalam standar Unicode. UTF-8 adalah kompatibel dengan ASCII. UTF-8 adalah pengkodean disukai untuk halaman e-mail dan web |
UTF-16 | 16-bit Format Transformasi Unicode adalah variabel-panjang karakter encoding untuk Unicode, mampu encoding Unicode seluruh repertoar. UTF-16 digunakan dalam sistem operasi utama dan lingkungan, seperti Microsoft Windows 2000/XP/2003/Vista/CE dan Jawa dan. Lingkungan byte NET kode |
Tip: Semua HTML 4 prosesor sudah mendukung UTF-8, dan semua XHTML dan XML prosesor dukungan UTF-8 dan UTF-16!
0 komentar