Pojmenování znaků je vlastně slovní popis znaku tak, aby pro jeho zápis byla použita výhradně písmena anglické abecedy a byl proto kdekoliv čitelný. V oblasti latinky se používá systém typu písmeno - akcent v krátké podobě, kterou bychom mohli nazvat PostScriptovým názvem, a dlouhé podobě, kterou používají tabulky UNICODE i pro jiná písma, než latinku. Například písmeno "Č" se v PostScriptu jmenuje "Ccaron", tedy písmeno je "C" a akcent je "caron"] tedy háček. Malé "č" se jmenuje analogicky "ccaron". V tabulkách UNICODE se jmenují poněkud složitěji: "LATIN CAPITAL LETTER C WITH CARON" a "LATIN SMALL LETTER C WITH CARON".
Někdy je problém zjistit správný název znaku (glyfu), nebo přichází v úvahu víc možností. Pak je třeba podívat se na správný vzhled na webovskou stránku UNICODE na adrese http://www.unicode.org. Zde se dají stáhnout tabulky znaků ve formátu PDF, nebo je prohlédnout online a určit správné jméno a číslo.
V dodané tabulce je v prvním sloupci číslo UNICODE, ve druhém název. Informace v dalších sloupcích nejsou pro tvorbu tabulek potřeba a obsahují doplňkové informace, jako je jazyk nebo oblast použití, nebo alternativní název.
Při tvorbě názvů znaků je třeba znát názvy hlavních akcentů. Úplný seznam najdete samozřejmě zase v tabulce UNICODE. Pro usnadnění jsou zde v tabulce:
Název | popis |
acute | čárka nad písmenem |
caron | háček |
cedilla | spodní francouzský ocásek |
circumflex | stříška |
diaeresis | přehláska – dvě tečky vodorovně nad písmenem |
ogonek | spodní ocásek polský |
slash | šikmé přeškrtnutí |
Další přehled akcentů je v souboru U300.pdf, některé akcenty mohou být i v jiných oblastech kódů. V případě nejasností se podívejte do tabulky UNICODE a stáhněte si PDF se vzhledem příslušných znaků.
Jako příklad uvádíme část převodní tabulky z kódu WINDOWS 1250, používaného ve střední Evropě:
windows--1250 /* Copyright Hukatronic (H.C.C.) Tomas Hurka tom@huaktronic.cz * This is conversion table from windows lantin 2 code page 1250 to unicode. * This file is part of the CONVERT Calamus module and should be in the * $(MODULES)/CONVERT.CFG directory. * The format is win. character = unicode character. It is possible to use * both decimal and hexadecimal numbers. White spaces are skipped, C and C++ * like comments are allowed all over the file. */ 130= 0x201A /*quote single left low*/ 131= 0x192 /*fhook, florin*/ 132= 0x201e /*DOUBLE LOW--9 QUOTATION MARK*/ 133= 0x2026 /*ellipsis*/ 134= 0x2020 /*dagger*/ 135= 0x2021 /*daggerdbl*/ 136= 0x5e 1 /*circumflex*/ 137= 0x2030 /*per mille*/ 138= 0x160 /*scaron*/ . . . |
v této tabulce je v první řádce název tabulky, který se objeví v ovládacím dialogu. Mezi znaky /* a */ je zapsán komentář. Veškeré tabulky si dostatečně komentujte, jinak se v nich po nějakém čase nevyznáte a na jejich znovupochopení spotřebujete několikrát více času, než byste ušetřili na napsání komentářů.
Další řádky již obsahují převod jednotlivých znaků. První číslo je číslo znaku v převáděném kódu, druhé číslo za rovnítkem je číslo UNICODE. Obě čísla mohou být dekadická nebo hexadecimální. Hexadecimální mají na začátku vždy 0x.
Je–li při startu modulu nalezena syntaktická chyba, hlásí to modul výstražným dialogem s oznámením čísla řádky, na které byla chyba nalezena