HTML Karakter Set


HTML Karakter Set

Untuk menampilkan halaman HTML dengan benar, browser harus tahu apa karakter-set untuk digunakan.
Karakter-set untuk dunia web yang luas awal adalah ASCII. ASCII mendukung angka dari 0-9, abjad Inggris huruf besar dan huruf kecil, dan beberapa karakter khusus.
Lengkapi referensi ASCII .
Karena banyak negara menggunakan karakter yang bukan merupakan bagian dari ASCII, default character-set untuk browser modern adalah ISO-8859-1.
Lengkap ISO-8859-1 referensi .
Jika halaman web menggunakan karakter yang berbeda-set dari IS
O-8859-1, harus ditentukan dalam tag <meta>.
Coba sendiri

Karakter ISO Set

Ini adalah Organisasi Standar Internasional (ISO) yang mendefinisikan standar karakter-set untuk abjad yang berbeda / bahasa.
Para karakter yang berbeda-set yang digunakan di seluruh dunia tercantum di bawah ini:
Karakter set Deskripsi Meliputi
ISO-8859-1 Abjad Latin bagian 1 Amerika Utara, Eropa Barat, Amerika Latin, Karibia, Kanada, Afrika
ISO-8859-2 Abjad Latin bagian 2 Eropa Timur
ISO-8859-3 Abjad Latin bagian 3 SE Eropa, Esperanto, lain aneka
ISO-8859-4 Abjad Latin bagian 4 Skandinavia / Baltik (dan lain-lain tidak dalam ISO-8859-1)
ISO-8859-5 Latin / Cyrillic bagian 5 Bahasa yang menggunakan alfabet Cyrillic seperti Bulgaria, Belarusia, Rusia dan Macedonia
ISO-8859-6 Latin / Arab bagian 6 Bahasa yang menggunakan huruf Arab
ISO-8859-7 Latin / Yunani bagian 7 Bahasa Yunani modern serta simbol matematika berasal dari bahasa Yunani
ISO-8859-8 Latin / Ibrani bagian 8 Bahasa yang menggunakan abjad Ibrani
ISO-8859-9 Latin 5 bagian 9 Bahasa Turki. Sama seperti ISO-8859-1 karakter kecuali Turki yang menggantikan Islandia
ISO-8859-10 Latin 6 Lappish, Nordic, Eskimo The Nordic bahasa
ISO-8859-15 Latin 9 (alias Latin 0) Mirip dengan ISO 8859-1 tetapi menggantikan beberapa simbol yang kurang umum dengan tanda euro dan beberapa karakter lainnya hilang
ISO-2022-JP Latin / Jepang bagian 1 Bahasa Jepang
ISO-2022-JP-2 Latin / Jepang bagian 2 Bahasa Jepang
ISO-2022-KR Latin / Korean bagian 1 Bahasa Korea


The Standard Unicode

Karena karakter-set yang tercantum di atas terbatas dalam ukuran, dan tidak kompatibel di lingkungan multibahasa, Konsorsium Unicode mengembangkan standar Unicode.
Standar Unicode mencakup semua karakter, punctuations, dan simbol di dunia.
Unicode memungkinkan pengolahan, penyimpanan dan pertukaran data teks tidak peduli apa platform, tidak peduli apa program, tidak peduli apa bahasa.

Konsorsium Unicode

Konsorsium Unicode mengembangkan standar Unicode. Tujuan mereka adalah untuk mengganti karakter yang ada-set dengan Format Transformasi standar Unicode (UTF).
Standar Unicode telah menjadi sukses dan diimplementasikan dalam XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML, dll standar Unicode juga didukung dalam banyak sistem operasi dan semua browser modern.
Konsorsium Unicode bekerja sama dengan organisasi standar memimpin pengembangan, seperti ISO, W3C, dan ECMA.
Unicode dapat diterapkan oleh rangkaian karakter-berbeda. Pengkodean yang paling sering digunakan adalah UTF-8 dan UTF-16:
Karakter-set Deskripsi
UTF-8 Sebuah karakter dalam UTF8 dapat dari 1 sampai 4 byte panjang. UTF-8 bisa mewakili setiap karakter dalam standar Unicode. UTF-8 adalah kompatibel dengan ASCII. UTF-8 adalah pengkodean disukai untuk halaman e-mail dan web
UTF-16 16-bit Format Transformasi Unicode adalah variabel-panjang karakter encoding untuk Unicode, mampu encoding Unicode seluruh repertoar. UTF-16 digunakan dalam sistem operasi utama dan lingkungan, seperti Microsoft Windows 2000/XP/2003/Vista/CE dan Jawa dan. Lingkungan byte NET kode
Tip: 256 karakter pertama dari Unicode karakter-set sesuai dengan 256 karakter ISO-8859-1.
Tip: Semua HTML 4 prosesor sudah mendukung UTF-8, dan semua XHTML dan XML prosesor dukungan UTF-8 dan UTF-16!
Load disqus comments

0 komentar