specjalny charakter
Znak specjalny to (w typografii / typometrii i cyfrowym przetwarzaniu danych ) znak, który nie jest ani literą, ani cyfrą .
Znaki specjalne obejmują znaki interpunkcyjne ( znaki interpunkcyjne , słowo wskazuje na ) oraz naukowe i symbole techniczne. Znaki specjalne to także znaki diakrytyczne . B. ostry lub breve (é, ă).
Różne znaczenia i zmienne znaczenie
Znaki specjalne obejmują również znaki niedrukowalne, które służą jako pomoc w orientacji podczas projektowania szablonu drukowania, takie jak spacje , a czasami nie.
Nie jest nieco jasne, czy z. B. Umlauty to znaki specjalne, zgodnie z podaną definicją wiąże się to z kwestią, czy na przykład „Ę” jest niezależną literą, którą należy odróżnić od „A”, patrz alfabet niemiecki. # Kontrowersyjna liczba liter . W szwedzkim , fińskim i estońskim, jednak, a jest odrębnym pismem. W niektórych przypadkach cyfry są również zawarte w znakach specjalnych.
Litery greckie mogą być symbolami, jeśli nie są używane do tworzenia greckich słów, ale jako zmienne (np. W statystyce σ dla odchylenia standardowego ) lub stałe (np. Dla numeru koła π).
„Wprowadzanie znaków specjalnych” jest często używane do opisu metod wprowadzania danych (na klawiaturach komputerów ) (na stronach internetowych o tytule „Znaki specjalne”, patrz #Weblinks i metoda wprowadzania #Weblinks ), przy czym wprowadzanie wszystkich znaków jest traktowane bez kodu ASCII , w tym litery -Języki niemieckie. Duńska mała litera ø jest często wymieniana jako przykład.
Znaki specjalne i technologia
We wczesnych latach informatyki ograniczenie zestawów znaków do 7 lub 8 bitów wynikało z przyczyn technicznych. Aby uniknąć wielu powiązanych problemów - na przykład, gdy wprowadzono symbol euro, trzeba było usunąć inny znak z ISO 8859-15 , 8-bitowe rozszerzenie ASCII - obecnie coraz częściej stosuje się większą liczbę bitów na znak .
Nie ma jednak wyraźnego związku między terminem znaki specjalne a postępem w technologii kodowania. Z 94 drukowalnych znaków ASCII 32 to znaki specjalne, czyli dokładnie jedna trzecia. Symbole prostszych zdań matematycznych są już wśród nich dostępne, a jeśli chodzi o znaki interpunkcyjne, Unicode (patrz poniżej) ma tylko warianty typograficzne linii poziomej ( ćwierćkwadrat , półkwadrat , kwadrat , znak minus ), cudzysłowy i Dodano te elipsy (które były wcześniej dostępne z TeX z 7-bitowych zestawów znaków). Terminologia nie jest jasna, jeśli chodzi o pytanie, czy większość nowo zakodowanych znaków w porównaniu z ASCII to znaki specjalne (np. Umlauty, patrz wyżej).
Użycie znaków specjalnych ASCII nie wymaga żadnej specjalnej technologii w porównaniu z literami i cyframi ASCII. Większość (lub wiele) znaków specjalnych ASCII (znaki interpunkcyjne, znaki matematyczne) można osadzić w kodzie źródłowym tekstów cyfrowych równie łatwo jak litery i cyfry. Jednak w przypadku różnych technologii ( nazwy plików , programowanie, kodowanie adresów URL , inne do naśladowania), niektóre znaki specjalne ASCII mają specjalną funkcję składniową (na przykład zwane „znakami zastrzeżonymi”), co utrudnia ich wyświetlenie . Do takich celów używane są znaki specjalne ASCII , aby maksymalnie utrudnić użytkownikom wprowadzanie tekstu.
Kolejną kwestią jest układ klawiatury . Nawet w czasach maszyny do pisania klawiatury niemieckie i amerykańskie różniły się głównie układem i obecnością znaków specjalnych. Dzięki skrótom ilość znaków, które można wstawić bezpośrednio do znaku źródłowego, jest rozszerzona na klawiatury komputerowe w głównych systemach operacyjnych. Jest kwestią terminologii, czy wszystkie dodatkowe znaki dostępne w ten sposób są znakami specjalnymi .
Niezależnie od koncepcji znaków specjalnych, należy zauważyć, że niektóre technologie były pierwotnie zaprojektowane tylko dla znaków ASCII, aczkolwiek bardziej dla programistów niż dla użytkowników.
W 80-znakowym kodzie karty dziurkowanej IBM cyfry, litery i cyfry były reprezentowane na różne sposoby.
Unicode
W nowoczesnych systemach nawet bardzo odległe znaki specjalne mogą być używane bez większych ceregieli. Rozwinęły się różne metody (z konieczności).
Unicode jest uważany za najnowocześniejszą i najbardziej ogólną formę implementacji. Każdy znak na tym świecie, czy to symbol recyklingu, czy znak chiński , ma swoje miejsce w tabelach Unicode i jest mapowany na komputerze jako lokalizacja pamięci zawierająca jeden lub więcej bajtów. Każdy znak Unicode ma swój własny numer. Tabele znaków obejmują między innymi:
- U + 0935 dla znaku व.
HTML
Jednostki postaci
Encje znakowe umożliwiają reprezentowanie tysięcy różnych znaków w plikach HTML zakodowanych w ASCII. W każdym przypadku mogą być wyświetlane warianty liter, symbole i znaki interpunkcyjne, dla których 7 bitów nie jest wystarczających. - Bardziej ogólnie omówiono ten temat w artykule „ Jednostki w językach znaczników” .
Numeryczne jednostki znakowe
W HTML można przekazać znak z Unicode pozycji NUM
za pomocą kodu ( napisane po przecinku ) w widoku przeglądarki, alternatywnie poprzez jeśli szesnastkowy zapis jest dla , przykładowo lub za matematyczny „mniej niż” znak „<”, który ma pozycja 60 w ASCII jak w Unicode. W tym przypadku mówi się o liczbowych jednostkach znakowych . Rozpoczynasz od ( symbol ampersand , po którym następuje znak krzyżyka ) i kończysz na ( średnik ). W ten sposób można przedstawić zarówno znaki ASCII, jak i praktycznie wszystkie znaki, które można nazwać „znakami specjalnymi”.
&#NUM;
NUM
&#xHNUM;
HNUM
NUM
<
<
&#
;
Nazwane jednostki znakowe i znaki „natywne HTML”
Nazwane jednostki znakowe, których „nazwy” są łatwe do zapamiętania, zostały wprowadzone dla pojedynczych znaków, które są szczególnie często używane . Na przykład symbol „mniej niż” może być również <
reprezentowany przez, „nazwa” lt
jest skrótem od „mniej niż”. Kod zaczyna się ponownie &
i kończy na ;
, ale brakuje znaku funta.
Powyższe dotyczy głównie znaków niezakodowanych w ASCII . Spośród 32 znaków specjalnych ASCII tylko trzy należy traktować w następujący sposób:
- znak „mniej niż” - patrz wyżej
- znak „większe niż” - odpowiednik poprzedniego, utworzone są „znaczniki” HTML ( ) - może być reprezentowane przez
<ELTNAME ATTR>TEXT</ELTNAME>
>
- to,
&
który podmiot się przedstawia - reprezentowany przez&
.
Znaki te nazywane są znakami „specyficznymi dla HTML”, można je również nazywać „znakami zastrzeżonymi” (jak w przypadku kodowania adresów URL ).
W związku z wartościami atrybutów może być również przydatne zastąpienie "
(„prowizoryczny podwójny cudzysłów”) "
i '
(„prowizoryczny pojedynczy cudzysłów”) na '
(„apostrof”). Jeśli jednak poszukuje się typografii wysokiej jakości, środki te nie są wystarczające.
W każdym razie nazwane encje znakowe ułatwiają tworzenie plików HTML za pomocą edytora tekstu. Znaki pokazane w ten sposób obejmują warianty literowe (ze znakami diakrytycznymi), symbole matematyczne (mogą to być również strzałki i litery greckie) oraz warianty typograficzne znaków interpunkcyjnych (→ znaki interpunkcyjne ). W 1995 r. „Nazwy” zostały wprowadzone dla znaków spoza ASCII w ISO 8859-1 , w 1999 r. Więcej dla poszczególnych znaków Unicode , patrz Nazwane jednostki znakowe w artykule Entities in Markup Languages .
Specyfikacja kodowania kodu źródłowego
Ponadto przeglądarki HTML (przeglądarki) można poinstruować, aby konwertowały tekst, który nie jest zakodowany w ASCII, zgodnie z zamierzeniami, poprzez wyraźne określenie kodowania tekstu źródłowego w nagłówku pliku:
<meta http-equiv="content-type" content="text/html; charset=UTF-8">
Jako alternatywę dla ISO-8859UTF-8
można również określić warianty. W obu przypadkach, encje znaków są potrzebne, po prostu , , (i / ) szukać.
&
<
>
"
'
Obie metody - użycie encji i określenie kodowania znaków - mogą być używane jednocześnie bez żadnych problemów.
Co jest lepsze?
Artykuł Entities in Markup Languages omawia dwie przedstawione możliwości, znaki spoza ASCII (czy to litery, cyfry czy znaki specjalne) w sekcjach Future of Character Entities i Adnotation . (Stan na połowę lutego 2016 r.)
Lateks
LaTeX jest popularny do tworzenia dokumentów naukowych , pierwotnie opracowanych przez informatyków Donalda E. Knutha ( TeX ) - dla American Mathematical Society - i Leslie Lamport (LaTeX).
Znaki specjalne bez kodu ASCII
Kodowanie znaków
Podobnie jak w przypadku HTML, możesz określić kodowanie znaków w tekście źródłowym, aby zawrzeć umlauty i znaki diakrytyczne bezpośrednio w kodzie źródłowym dokumentu, tutaj za pomocą linii preambuły
\usepackage[utf8]{inputenc}
alternatywnie latin1
raczej zamiast utf8
pracy ze starszymi plikami źródłowymi zgodnie z kodowaniem ISO 8859-1 . Bez pakietu inputenc nie można przetwarzać plików z rozszerzeniami ASCII (domyślnie LaTeX przetwarza pliki źródłowe jako zakodowane w ASCII) - przynajmniej z oryginalnym silnikiem TeX Knutha lub z pdfTeX ( ). XeTeX ( ) i LuaTeX interpretują pliki źródłowe w ich domyślnym ustawieniu jako zakodowane w UTF-8 . W przypadku UTF-8 (tj. Unicode) w zasadzie wszelkie symbole wymagane w różnych dziedzinach , na przykład w matematyce (dla której został pierwotnie utworzony), tworzą szczególnie dużą część „znaków specjalnych” (niezakodowanych Pozycja ASCII), można wstawić bezpośrednio jako pojedynczy znak w kodzie źródłowym dokumentu LaTeX. Dostępne są również warianty typograficzne zakodowane w znakach interpunkcyjnych ASCII (w wersji 8-bitowej tylko niestandardowe, niestandardowe Windows-1252 oferuje myślniki typograficzne ).
pdflatex
xelatex
Kodowanie za pomocą kombinacji ASCII
Jakość typograficzna zawsze była możliwa dzięki LaTeX bez rozszerzania kodowania znaków. Myślnik w połowie ćwiartki ( myślnik ) uzyskuje się za pomocą kodu ASCII --
, myślnik (myślnik angielski) z kropką i zadowalające typograficznie pominięcie . Postać pierwotnie pomyślana jako Grave akcent jest pokazany reprezentować pojedynczy cudzysłów w lewym górnym rogu, na podwójnym cudzysłowie, pojedyncze cudzysłowy są dwukrotnie. Warianty liter z łączonymi znakami były pierwotnie reprezentowane przez przesuwające się litery i glify diakrytyczne dostarczane osobno w zestawach znaków ; te ostatnie pojawiają się w kodzie (poza formułami) jako kombinacja początkowego ukośnika odwrotnego (w kodzie szesnastkowym ASCII 5C) i innego znaku, dzięki czemu , na przykład „Ę” jest generowany przez. Dzięki dodatkowemu pakietowi makr w języku niemieckim można było pisać krócej i bardziej czytelnie , co oznacza, że kropki są umieszczone trochę niżej poprawnie typograficznie niż w języku angielskim. To właśnie takie warianty liter można łatwo wstawić do pliku kodu źródłowego za pomocą klawiatur zaprojektowanych dla alfabetu łacińskiego , tak że te kombinacje poleceń mogą stać się przestarzałe z powodu rozszerzeń ASCII; Z drugiej strony, pliki z kodem źródłowym muszą być wymieniane podczas wspólnego pisania tekstów, a pliki źródłowe są wysyłane do anglojęzycznych czasopism lub wydawców, chociaż pliki zakodowane w ASCII, ISO 8859-1 i UTF-8 wciąż mogą się „pomieszać” „w takich przypadkach może być wskazane dalsze używanie kombinacji poleceń.
---
\dots
\
\"{A}
"A
LaTeX również automatycznie używa ligatur , które jednak często są nieodpowiednie w tekstach niemieckich i muszą zostać specjalnie usunięte.
Ponadto dostępne są zestawy znaków LaTeX z łącznie tysiącami symboli specyficznych dla tematu z Comprehensive TeX Archive Network lub dystrybucjach TeX , w połączeniu z pakietami makr, które oferują kombinację początkowego ukośnika odwrotnego i liter ASCII jako polecenia dla każdego symbolu ( → #Weblinks ). Zatem te symbole zajmują pozycję w zestawie znaków zarządzanym przez jednego twórcę (lub mały zespół), niekoniecznie (koniecznie) w systemie administrowanym przez organ normalizacyjny. W przypadku niektórych indywidualnych punktów kodowych Unicode kilka pakietów TeX lub LaTeX oferuje różne style czcionek (np. Dla symbolu euro € ). Podobnie jak „nazwane jednostki” w HTML, sekwencje liter są wybierane zgodnie z mnemonicznymi kryteriami. B. \cup
jak ∪
dla zadanej unia symbolu .
Jako zaleta wprowadzania symboli ASCII w porównaniu z bezpośrednim wstawianiem znaków Unicode za pomocą skrótów klawiaturowych lub z tabeli znaków lub paska narzędzi , czasami stwierdza się, że autor może skoncentrować się w dużej mierze na treści tekstu, podczas gdy jego palce są w dużej mierze w nieprzerwanym przepływie, jak podczas gry na pianinie wędrując po klawiaturze bez świadomej kontroli w systemie 10-palcowym . W przypadku poleceń, które są często wymagane, można (w przeciwieństwie do HTML ze sztywno określoną składnią - za pomocą \newcommand
lub \renewcommand
) wprowadzić krótsze polecenie „Alias”.
Znaki specjalne ASCII
Aby ułatwić wpisywanie i poprawić czytelność kodu, 10 znaków specjalnych ASCII - \{}$&#^_~%
„przywłaszczone” / „zastrzeżone” ( znaki funkcyjne ), np. B. dla (wynik „m²”), co wpisujesz w HTML lub do czego . Aby wyświetlić je z ASCII tak, jak były pierwotnie , możesz je " zamaskować " lewym ukośnikiem, z wyjątkiem i (które można utworzyć za pomocą dłuższych poleceń w zależności od kontekstu) , na przykład wpisując symbol dolara $ .
m$^2$
m²
m<sup>2</sup>
\
~
\$
W LaTeX niektóre polecenia szukają następujących lewych nawiasów kwadratowych [
lub gwiazdy *
. W szczególnych przypadkach powoduje to trudności, na przykład jeśli chcesz rozpocząć nowy wiersz nawiasami kwadratowymi. Zamiast \\[
pisać lepiej .
\\{}[
Punycode
Aby móc reprezentować umlauty i inne znaki specjalne w nazwach domen , opracowano procedurę Punycode , która wraz z Nameprep tworzy standard dla międzynarodowych nazw domen (IDN). Znaki spoza zestawu ASCII są zastępowane łącznikami, a ich reprezentacja jest dołączana na końcu słowa.
Zobacz też
literatura
- Johannes Bergerhausen, Siri Poarangan: decodeunicode: Postacie świata Hermann Schmidt, Moguncja, 2011, ISBN 978-3874398138 . Ze wszystkimi znakami specjalnymi wszystkich systemów pisma
- Helmut Hiller, Stephan Füssel : Słownik książki. 7. wydanie gruntownie zmienione. Vittorio Klostermann, Frankfurt nad Menem 2006, ISBN 3-465-03495-3
- Ursula Rautenberg (Hrsg.): Reclams Sachlexikon des Buches. 2. poprawiona edycja. Philipp Reclam cze., Stuttgart 2003, ISBN 3-15-010542-0
- Konsorcjum Unicode: standard Unicode, wersja 6.0.0 . Konsorcjum Unicode, Mountain View CA, 2011, ISBN 978-1-936213-01-6
linki internetowe
HTML i Unicode
- Dodatkowy pakiet makr w języku niemieckim
- Pakiet inputenc
- Pomoc: Specjalne odniesienie do znaków z niemieckiej Wikipedii
- ZEICHEN.TV - Znaki specjalne w HTML i Unicode z funkcją wyszukiwania
- ASCII, DOS-Latin-1, Windows-1252 i HTML autorstwa Torsten Horn
Lateks
- Scott Pakin: Kompleksowa lista symboli LaTeX. (PDF; 8,6 MiB) W: Kompleksowa sieć archiwów TeX . 12 listopada 2015 r., Dostęp 4 lutego 2016 r. (Ilustracja 14030 z dostępnymi symbolami LaTeX na 331 stronach, spis treści i indeks pomocy przy wyszukiwaniu).
- detexify - aplikacja internetowa nadająca nazwę makra rysunkowi symbolu, za pomocą którego jest on reprezentowany przez LaTeX
Indywidualne dowody
- ↑ Wolfgang Beinert : znaki specjalne. W: Typolexikon . 22 sierpnia 2006, obejrzano 7 lutego 2016 .
- ↑ znaki specjalne. W: Duden online . Źródło 7 lutego 2016 r .
- ↑ a b Jo Appel, Manfred Leubner, Wolfgang Manekeller, Ute Mielow, Helga Rühling, Annelore Schliz, Annemarie Weighardt: Gabler Büro Lexikon . Springer-Verlag, 2013, s. 259 f . ( [Str. 259] - „Oprócz liter i cyfr istnieją różne inne znaki; [str. 260] te tak zwane S. obejmują na przykład symbole operacji arytmetycznych (+ - /) i symbole handlowe (& %). ”).
- ↑ a b c Lutz J. Heinrich, Armin Heinzl, Friedrich Roithmayr: Wirtschaftsinformatik-Lexikon . Walter de Gruyter, 2004, s. 612 ( ograniczony podgląd w Google Book Search [dostęp 7 lutego 2016 r.] „Znak, który nie jest literą, cyfrą ani spacją. Np. E dla S. to znaki do operacji arytmetycznych, znaki interpunkcyjne, symbole skrótów, znaki sterujące. ”).
- ^ A b c Detlef Jürgen Brauner, Robert Raible-Beste, Martin M. Weigert: Multimedia-Lexikon . Walter de Gruyter, 1998, s. 319 ( ograniczony podgląd w Google Book Search [dostęp 7 lutego 2016 r.] „Wszystkie znaki oprócz liter alfabetu, tj. Cyfry, znaki interpunkcyjne, ligatury, akcenty itp.”).
- ↑ a b Ursula Rautenberg, Dirk Wetzel: książka . Walter de Gruyter, 2001, s. 22 ( ograniczony podgląd w Google Book Search [dostęp: 7 lutego 2016 r.] „Tym, co różni się od tych liter zawierających obrazy, jest niedrukowalny materiał zastępczy (znaki ikoniczne jako typograficzne„ znaki zerowe ”), za pomocą którego, na przykład, słowo i odstępy między wierszami ”).
- ↑ klawisz skrótu. W: Duden online . Źródło 7 lutego 2016 r .
- ↑ „Odniesienie: HTML / odniesienie do znaków”. W: SELFHTML . Pobrano 7 maja 2021 r .