Znaki diakrytyczne i oznaczanie języka dokumentu
Wprowadzenie
Znaki diakrytyczne to specjalne znaki używane w wielu językach, które modyfikują litery i zmieniają ich wymowę lub znaczenie. Przykłady to polskie „ą”, „ę”, „ć”, niemieckie „ä” czy francuskie „é”. W kontekście stron internetowych, prawidłowe wyświetlanie tych znaków wymaga odpowiedniego kodowania.
Oznaczanie języka dokumentu HTML umożliwia przeglądarkom i narzędziom wspomagającym lepsze zrozumienie tekstu, poprawną interpretację znaków oraz poprawną obsługę funkcji takich jak sprawdzanie pisowni czy interpretacja dat.
Teoria
1. Znaki diakrytyczne i kodowanie znaków
- Znaki diakrytyczne: Znaki nad i pod literami, które zmieniają wymowę lub znaczenie słów. Są używane w wielu językach i muszą być prawidłowo zakodowane w stronach internetowych.
- Kodowanie znaków: HTML obsługuje różne sposoby kodowania znaków, ale najpopularniejszym standardem jest UTF-8, który obsługuje szeroki zakres znaków.
- Deklaracja kodowania w HTML: W celu poprawnego wyświetlania wszystkich znaków, kodowanie powinno być zadeklarowane w sekcji
<head>
dokumentu HTML, co zapewnia poprawne renderowanie tekstu w różnych przeglądarkach i systemach operacyjnych.
2. Oznaczanie języka dokumentu HTML
- Znacznik
lang
: Oznaczenie języka w dokumencie HTML pozwala przeglądarkom lepiej rozumieć i wyświetlać tekst. Umożliwia również narzędziom, takim jak czytniki ekranowe, poprawną interpretację wymowy tekstu i innych funkcji. - Oznaczanie języka dla całego dokumentu: Zazwyczaj język dla całego dokumentu oznacza się w znaczniku
<html>
, np. dla języka polskiego czy angielskiego. - Oznaczanie języka dla poszczególnych sekcji: Możliwe jest również określenie języka dla poszczególnych sekcji tekstu, co jest przydatne na stronach wielojęzycznych.
3. Escapowanie znaków specjalnych w HTML
- Znaki specjalne w HTML: Niektóre znaki, takie jak
<
,>
czy&
, mają specjalne znaczenie w HTML i wymagają użycia tzw. kodów encji (entity codes), aby były poprawnie wyświetlane. - Escapowanie znaków: Stosowanie kodów HTML dla znaków specjalnych, aby przeglądarka wyświetlała je poprawnie bez interpretowania ich jako część kodu HTML.
4. Lokalizacja a język dokumentu
- Lokalizacja strony: Oznaczanie języka i kodowanie znaków ma kluczowe znaczenie w procesie lokalizacji strony internetowej, czyli dostosowywania jej do odbiorców z różnych regionów świata. Dzięki temu strona może automatycznie dostosować formaty dat, waluty, jednostki miary oraz inne elementy językowe.
Ćwiczenia Praktyczne
Ćwiczenie 1: Dodawanie kodowania UTF-8 i oznaczanie języka
- Utwórz nowy dokument HTML.
- W sekcji
<head>
dodaj deklarację kodowania UTF-8. - Oznacz język dokumentu na polski.
- Wstaw nagłówek i paragraf zawierający polskie znaki diakrytyczne.
Ćwiczenie 2: Tworzenie dokumentu z różnymi językami
- Stwórz dokument HTML, w którym znajdą się teksty w dwóch językach: polskim i angielskim.
- Oznacz język dokumentu za pomocą atrybutu
lang
. - Każda sekcja tekstu powinna być odpowiednio oznaczona językiem (polski i angielski).
Ćwiczenie 3: Escapowanie znaków specjalnych
- Utwórz dokument HTML, w którym poprawnie wyświetlisz tekst zawierający znaki specjalne, takie jak
<
,>
,&
. - Dodatkowo, dodaj fragmenty tekstu z innymi znakami diakrytycznymi, np. z francuskiego, niemieckiego, hiszpańskiego.
- Przykłady słów do escapowania:
- 10 > 5 & 5 < 10
- Brève mise à jour
- Übersetzung & Gestaltung
- Café "La Luna"
- 50% zniżki na "wszystko"
- ¿Cómo estás?
Ćwiczenie 4: Dokument HTML z wielojęzycznymi sekcjami
- Utwórz dokument HTML z pięcioma sekcjami, w których znajdą się teksty w różnych językach:
- Polski
- Francuski
- Niemiecki
- Hiszpański
- Włoski
- Oznacz odpowiednio język każdej sekcji za pomocą atrybutu
lang
. - Każda sekcja powinna zawierać nagłówek i akapit tekstu w danym języku.