I caratteri

Lo standard Unicode

«I computer, in buona sostanza, non sanno far altro che trattare numeri. Per immagazzinare in memoria lettere o altri segni è necessario che a ogni carattere venga assegnato un numero. Esistono centinaia di sistemi di codifica, preesistenti a Unicode, e ognuno di questi abbina i numeri ai caratteri in modo differente. Nessuna di queste codifiche comprende un numero di caratteri sufficiente per tutte le circostanze. Per le sole lingue dell'Unione Europea, ad esempio, è necessario utilizzare parecchi sistemi di codifica distinti. Anche considerando una solo lingua, come l'italiano, non esiste una codifica unica che comprenda tutte le lettere e tutti i segni di punteggiatura e simboli tecnici di uso comune. Questi sistemi di codifica, inoltre, sono in contraddizione l'uno con l'altro. Succede che due codifiche utilizzino lo stesso numero per due caratteri diversi o che, viceversa, adottino numeri diversi per lo stesso carattere. Qualsiasi elaboratore, e a maggior ragione un server di rete, ha bisogno di utilizzare codifiche diverse. Il problema è che, quando i dati passano da una codifica a un'altra, o da una piattaforma a un'altra, si corre il serio rischio di perdere informazioni. Unicode sta cambiando le cose! Esso infatti attribuisce un numero univoco a ogni carattere, indipendentemente dalla piattaforma, dall'applicativo, dalla lingua.»

Liberamente tratto dal sito www.unicode.org

I font Unicode in rete

Sebbene lo standard Unicode comprenda la maggior parte degli alfabeti conosciuti, non tutti i tipi di caratteri (font) disponibili sui moderni computer è in grado di visualizzare tutti i glifi. Lo stesso Arial Unicode MS supporta nalla versione attuale (0.86) solo la versione 2.1 dell'Unicode e solo un certo numero di blocchi, pur coprendo quasi tutti i maggiori alfabeti. Inoltre questo tipo non è gratuito ma viene fornito assieme ad alcuni prodotti MS e comunque non è disponibile su altre piattaforme. Di conseguenza, per poter vedere alcuni alfabeti, come ad esempio il Cherokee o l'Etrusco, è necessario caricare altri tipi Unicode che, pur gestendo un numero inferiore di blocchi, hanno quelli che ci interessano per quella determinata lingua. Il Dizionario Unicode permette di specificare il tipo più adatto a un certo alfabeto, ma è necessario che l'utente lo installi sul proprio sistema. Pur essendo infatti molti tipi gratuiti, essi sono comunque coperti da diritti e non possono essere distribuiti con il dizionario senza l'autorizzazione dell'autore. Il programma comunque permette all'utente di selezionare per ogni lingua un eventuale tipo alternativo. E' fondamentale tuttavia che si tratti di un tipo Unicode. Un ottimo sito da cui partire è Alan Wood’s Unicode Resources. Un ottimo tipo è Code 2000, che comprende moltissimi glifi del piano base, e Code 2001 che comprende anche i caratteri degli alfabeti italici antici, non ancora supportati dal Dizionario Unicode tuttavia, purtroppo. Entrambi possono essere scaricati dal sito di James Kass, l'autore.