UTF-8 (Abkürzung für 8-Bit UCS Transformation Format, wobei UCS wiederum Universal Coded Character Set abkürzt) ist die am weitesten verbreitete Kodierung für Unicode-Zeichen (Unicode und UCS sind praktisch identisch).[→Wikipedia. Suchbegriff „UTF-8” Anruf 18.10.2020]
Ab der HTML-Version 5 ist die Angabe des Zeichensatzes iso-8859-1 nicht mehr zulässig. Zulässig ist dagegen der als veraltet deklarierte Zeichensatz windows-1252:
<meta http-equiv="content-type" content="text/html; charset=windows-1252">
Der empfohlene Zeichensatz für HTML Version 5 ist UTF-8 ohne BOM:
<meta http-equiv="content-type" content="text/html; charset=UTF-8">
Lediglich 3 Zeichen dürfen im Text nicht unmittelbar angegeben werden, da sie in HTML eine spezielle Bedeutung haben. Es sind:
E-Mail-Adressen in Webseiten werden von manchen Firmen gesammelt, um Opfer für Werbe-Mails zu finden. Wenn man als Web-Autor die eigene E-Mail-Adresse codiert in Unicode angibt, haben viele der Adresssammelroboter Schwierigkeiten.
In der Browserdarstellung erscheint die E-Mail-Adresse weiterhin in Klarschrift.
Anwendungsbeispiel in HTML-Codierung:
Meine E-Mail-Adresse: Nobody@hugo.de
Darstellung im Browser:
Meine E-Mail-Adresse: Nobody@hugo.de
Besser ist es, die eigene E-Mail-Adresse nicht als Text, sondern als Grafik anzuzeigen. Dann muss sie jemand vom Bildschirm abtippen!
Einige benannte Zeichen (Entity Reference): Bei den nachfolgenden Angaben handelt es sich um eine kleine Auswahl. Weiterführende Informationen sind über [→Wikipedia (Suchbegriff: UTF-8)] zu finden. | |
" " doppeltes Anführungszeichen &squot; ' einfaches Anführungszeichen. &squot; gilt nicht bei der Angabe „iso-8859-1”. Alternative: ' ' ' Auslassungszeichen. ' gilt nicht bei der Angabe „iso-8859-1”. Alternative: ' & & ¡ ¡ umgekehrtes Ausrufezeichen ¿ ¿ umgekehrtes Fragezeichen ‘ ‘ ’ ’ « « » » „ „ „Anführung” beginnt “ “ ” ” „Anführung” endet < < Kleiner als > > Größer als ≤ ≤ Gleich oder Kleiner als ≥ ≥ Gleich oder Größer als ≠ ≠ Ungleich ≈ ≈ Ungefährzeichen ∞ ∞ Unendlich ← ← ⇐ ⇐ → → ⇒ ⇒ ↓ ↓ ⇓ ⇓ ↑ ↑ ⇑ ⇑ ↔ ↔ ⇔ ⇔ • • Aufzählungszeichen £ £ Pfundzeichen € € Eurozeichen ¢ ¢ Centzeichen ¥ ¥ Yen-Zeichen ¤ ¤ Währungszeichen § § Paragraphenzeichen … … Auslassungszeichen © © Copyright ® ® eingetragene Marke ™ ™ nicht eingetragene Marke № № Numero Non Breaking Space. Leerzeichen. Ein Zeilenumbruch wird verhindert.   Thin Space. Schmales Leerzeichen zur Gruppierung von langen Zahlen oder Telefonnummern. Bei  ,   und   wird ein Zeilenumbruch nicht verhindert.   Zwischenraum in Breite von „n”   Zwischenraum in Breite von „m”   Non Breaking Thin Space |
– – Bindestrich – für „bis”: 2018–2019 ‑ ‑ fast wie Bindestrich. Dabei wird ein Zeilenumbruch verhindert. — — Gedankenstrich ‧ ‧ Bindepunkt (hochgestellter Punkt) » » « « ³ ³ hochgestellte 3 ² ² hochgestellte 2 ¹ ¹ hochgestellte 1 ½ ½ ¼ ¼ ¾ ¾ µ µ Microzeichen α α alpha β β beta λ λ lambda (z.B. Wellenlänge) ω ω omega (z.B. Kreisfrequenz) Ω Ω Omega (z.B. Widerstand) φ φ ψ ψ π π Kreiszahl Π Π θ θ Θ Θ ¶ ¶ Absatz-Zeichen ä ä deutsche Umlaute Ä Ä ö ö Ö Ö ü ü Ü Ü ß ß ♠ ♠ Pik-Zeichen ♣ ♣ Kreuz-Zeichen ♥ ♥ Herz-Zeichen ♦ ♦ Karo-Zeichen ± ± plusminus ° ° Grad ¬ ¬ logisches „nicht” Ø Ø durchgestrichenes O, wie ein Durchmesserzeichen √ √ Wurzelzeichen † † Kreuzzeichen ‰ ‰ Promillezeichen ≡ ≡ mathematisch „identisch”, drei breite Striche untereinander werden gerne als Markierung einer Auswahlliste verwendet ⌂ ⌂ Haus 🔊 🔊 Lautsprecher ✆ ✆ Telefon ☎ ☎ Telefon ☎ ☎ Telefon ☏ ☏ Telefon 📱 📱 Mobiles Telefon alias Handy |
Hinweise:
Folgende Bereiche sind von der Benutzung in HTML offiziell ausgeschlossen:
Codes von  bis &159; einschließlich sind Steuerzeichen vorbehalten. Das bedeutet u.a.: Statt „ für das Anführungszeichen „ sollte man besser „ nehmen, da „ mit einem Steuerzeichen verwechselt werden kann. Das passende rechte Anführungszeichen ist ”. In „benannter” Schreibweise sind es die Zeichen „ und ”. Statt ‰ für das Promillezeichen sollte man besser ‰ nehmen, da &137; mit einem Steuerzeichen verwechselt werden kann. Das deutsche Pfennigszeichen ₰ lässt sich durch ₰ bzw. ₰ darstellen. |
Einige benannte Zeichen (Entity Reference): Bei den nachfolgenden Angaben handelt es sich um eine kleine Auswahl. Weiterführende Informationen sind über [→Wikipedia (Suchbegriff: UTF-8)] zu finden. „Normale” Zeichen und Sonderzeichen im Unicode bis ÿ: | |||||||||||||||
  | ! | ! | " | " | # | # | $ | $ | % | % | & | & | ' | ' | |
( | ( | ) | ) | * | * | + | + | , | , | - | - | . | . | / | / |
0 | 0 | 1 | 1 | 2 | 2 | 3 | 3 | 4 | 4 | 5 | 5 | 6 | 6 | 7 | 7 |
8 | 8 | 9 | 9 | : | : | ; | ; | < | < | = | = | > | > | ? | ? |
@ | @ | A | A | B | B | C | C | D | D | E | E | F | F | G | G |
H | H | I | I | J | J | K | K | L | L | M | M | N | N | O | O |
P | P | Q | Q | R | R | S | S | T | T | U | U | V | V | W | W |
X | X | Y | Y | Z | Z | [ | [ | \ | \ | ] | ] | ^ | ^ | _ | _ |
` | ` | a | a | b | b | c | c | d | d | e | e | f | f | g | g |
h | h | i | i | j | j | k | k | l | l | m | m | n | n | o | o |
p | p | q | q | r | r | s | s | t | t | u | u | v | v | w | w |
x | x | y | y | z | z | { | { | | | | | } | } | ~ | ~ |  | |
€ |  | ‚ | ƒ | „ | … | † | ‡ | ||||||||
ˆ | ‰ | Š | ‹ | Œ |  | Ž |  | ||||||||
 | ‘ | ’ | “ | ” | • | – | — | ||||||||
˜ | ™ | š | › | œ |  | ž | Ÿ | ||||||||
  | ¡ | ¡ | ¢ | ¢ | £ | £ | ¤ | ¤ | ¥ | ¥ | ¦ | ¦ | § | § | |
¨ | ¨ | © | © | ª | ª | « | « | ¬ | ¬ | ­ | | ® | ® | ¯ | ¯ |
° | ° | ± | ± | ² | ² | ³ | ³ | ´ | ´ | µ | µ | ¶ | ¶ | · | · |
¸ | ¸ | ¹ | ¹ | º | º | » | » | ¼ | ¼ | ½ | ½ | ¾ | ¾ | ¿ | ¿ |
À | À | Á | Á | Â | Â | Ã | Ã | Ä | Ä | Å | Å | Æ | Æ | Ç | Ç |
È | È | É | É | Ê | Ê | Ë | Ë | Ì | Ì | Í | Í | Î | Î | Ï | Ï |
Ð | Ð | Ñ | Ñ | Ò | Ò | Ó | Ó | Ô | Ô | Õ | Õ | Ö | Ö | × | × |
Ø | Ø | Ù | Ù | Ú | Ú | Û | Û | Ü | Ü | Ý | Ý | Þ | Þ | ß | ß |
à | à | á | á | â | â | ã | ã | ä | ä | å | å | æ | æ | ç | ç |
è | è | é | é | ê | ê | ë | ë | ì | ì | í | í | î | î | ï | ï |
ð | ð | ñ | ñ | ò | ò | ó | ó | ô | ô | õ | õ | ö | ö | ÷ | ÷ |
ø | ø | ù | ù | ú | ú | û | û | ü | ü | ý | ý | þ | þ | ÿ | ÿ |
Die 24 Zeichen des griechischen Alphabets | |||||||||
---|---|---|---|---|---|---|---|---|---|
Zei- chen | Entity | Unicode dezimal | Unicode hexadezimal | großes | Zei- chen | Entity | Unicode dezimal | Unicode hexadezimal | kleines |
Α | Α | Α | Α | Alpha | α | α | α | α | Alpha |
Β | Β | Β | Β | Beta | β | β | β | β | Beta |
Γ | Γ | Γ | Γ | Gamma | γ | γ | γ | γ | Gamma |
Δ | Δ | Δ | Δ | Delta | δ | δ | δ | δ | Delta |
Ε | Ε | Ε | Ε | Epsilon | ε | ε | ε | ε | Epsilon |
Ζ | Ζ | Ζ | Ζ | Zeta | ζ | ζ | ζ | ζ | Zeta |
Η | Η | Η | Η | Eta | η | η | η | η | Eta |
Θ | Θ | Θ | Θ | Theta | θ | θ | θ | θ | Theta |
Ι | Ι | Ι | Ι | Iota | ι | ι | ι | ι | Iota |
Κ | Κ | Κ | Κ | Kappa | κ | κ | κ | κ | Kappa |
Λ | Λ | Λ | Λ | Lambda | λ | λ | λ | λ | Lambda |
Μ | Μ | Μ | Μ | Mu | μ | μ | μ | μ | Mu |
Ν | Ν | Ν | Ν | Nu | ν | ν | ν | ν | Nu |
Ξ | Ξ | Ξ | Ξ | Xi | ξ | ξ | ξ | ξ | Xi |
Ο | Ο | Ο | Ο | Omicron | ο | ο | ο | ο | Omicron |
Π | Π | Π | Π | Pi | π | π | π | π | Pi |
Ρ | Ρ | Ρ | Ρ | Rho | ρ | ρ | ρ | ρ | Rho |
Σ | Σ | Σ | Σ | Sigma | σ | σ | σ | σ | Sigma |
ς | ς | ς | ς | Final Sigma | |||||
Τ | Τ | Τ | 㨤 | Tau | τ | τ | τ | τ | Tau |
Υ | Υ | Υ | Υ | Upsilon | υ | υ | υ | υ | Upsilon |
Φ | Φ | Φ | Φ | Phi | φ | φ | φ | φ | Phi |
Χ | Χ | Χ | Χ | Chi | χ | χ | χ | χ | Chi |
Ψ | Ψ | Ψ | Ψ | Psi | ψ | ψ | ψ | ψ | Psi |
Ω | Ω | Ω | Ω | Omega | ω | ω | ω | ω | Omega |