Pubblicato il 29/01/18 - aggiornato il  | Nessun commento :

Cosa sono i codici ASCII e Unicode e come usarli con l'HTML

Cosa sono le codifiche ASCII e Unicode e come usarle per digitare caratteri speciali e per inserirli in pagine web
Come certo saprete l'unità della informazione è il bit che permette di discernere tra due eventi ugualmente probabili. Il bit è una cifra binaria e solitamente si utilizza il byte che è formato da 8 bit e che può quindi assumere 28 = 256 valori possibili. Nelle notazioni solitamente si usa la b piccola per il bit e la B grande per il byte. Vengono utilizzati anche i loro multipli Kb, Mb per Kilobit e Megabit e KB e MB per Kilobyte e Megabyte.

Nei nostri dispositivi come computer e cellulari non vediamo però solo numeri, ma anche lettere e caratteri speciali oltre a molte altre cose. Esiste quindi un meccanismo di corrispondenza tra numeri e caratteri all'interno dei computer con delle tabelle che sono uno standard internazionale.
La tabella più conosciuta è quella ASCII, acronimo di American Standard Code for Information Interchange, che è appunto un codice per la codifica dei caratteri. Tale tabella comprende 256 caratteri, tutti quelli rappresentabili con un byte. Tale tabella però non era sufficiente neppure per i caratteri delle lingue europee più comuni visto che devono essere rappresentati anche i caratteri di lettere accentate.

Fu allora deciso di creare una Tabella ASCII estesa che però ben presto diventò a sua volta insufficiente per poter rappresentare anche i caratteri di lingue diverse da quelle latine e anglosassoni come il cirillico, l'arabo, il cinese, il coreano, l'ebraico, il vietnamita, ecc.





I computer Windows 10 hanno la Mappa di caratteri, che permette all'utente di inserire in un documento caratteri speciali che non sono presenti nella tastiera. Si va su Start e si digita Mappa Caratteri

mappa-caratteri


Verranno mostrati caratteri nelle varie famiglie di font. Cliccando su un carattere si può andare su Seleziona per poi eventualmente andare su Copia e incollarlo in un documento o in una pagina web. In basso a destra si visualizzerà un codice utilizzabile per digitarlo con il tastierino numerico mentre sulla sinistra verrà mostrato il codice Unicode. Il codice in basso a destra sarà visibile solo per i caratteri supportati mentre quello sulla sinistra sarà sempre presente. Accanto ci sarà anche il nome in inglese del carattere selezionato.






In  questo modo in una post o anche in un editor semplicissimo come il Blocco Note possono essere inseriti caratteri astrusi come questi Ѥ,,҈,,, ݽ, ꬼ.

TABELLA ASCII


I caratteri ASCII possono essere inseriti anche con l'utilizzo del tastierino numerico nel caso in cui se ne conosca il codice relativo. Si può usare la tabella presente nella pagina di Wikipedia del precedente link oppure consultare altre tabelle con i codici ASCII come questa di Oppo.it.

tabella-ascii


Per digitare un carattere occorre ricavarne il suo codice decimale. Per esempio il carattere che mostra la frazione tre quarti ha il codice 243. Per inserire in un documento questo carattere, si abilita il tastierino numerico con il tasto Num Lock e, tenendo premuto il tasto Alt, si digita 243 con lo stesso tastierino ottenendo ¾.

Si può fare lo stesso con tutti i caratteri che hanno l'opzione Battuta in basso a destra nella Mappa dei caratteri di Windows. Viene proprio indicata la scorciatoia da tastiera Alt+... per ogni font.

TABELLA UNICODE


La codifica Unicode è stata introdotta perché quella ASCII era insufficiente e definisce in maniera univoca la corrispondenza fra un preciso carattere (sia esso latino, cirillico o cinese) e un numero di codice. Viene continuamente aggiornata dal Consorzio Unicode che aggiunge sempre nuovi caratteri. Ultimamente per esempio ha aggiunto delle nuove emoticon. Inizialmente era stato pensato come codifica a 16bit ma adesso si è passati a una codifica a 21bit con due milioni (221) di caratteri supportati in grado di rappresentare non solo tutte le lingue vive, ma anche quelle che non vengono più parlate e scritte ma che fanno parte della storia dell'umanità. Sono previste codifiche a 8bit, a 16bit e a 32bit definite rispettivamente UTF-8, UTF-16 e UTF-32.

UTF-8 sfrutta l'importante caratteristica di Unicode di essere parzialmente compatibile con la tabella ASCII. I primi 128 caratteri di Unicode sono infatti uguali alla tabella di base di ASCII. In alcune pagine HTML o XML esiste anche il tag che specifica la codifica Unicode come charset=utf-8 o encoding="utf-8".

I caratteri Unicode possono essere inseriti anche mediante l'Editor di Blogger. Infatti cliccando sulla icona della faccina, si aprirà una finestra per l'inserimento di caratteri speciali


La codifica dei caratteri Unicode di ciascun alfabeto può essere consultata in questa pagina del consorzio Unicode. Oltre al latino sono presenti i caratteri greci, quelli etiopici e persino i geroglifici egiziani.

COME INSERIRE UN CARATTERE SPECIALE IN UNA PAGINA WEB


Alcuni caratteri non vengono supportati dalle pagine web e altri vengono scambiati per simboli di markup come per esempio quelli di minore e maggiore utilizzati nei tag HTML.

Per aggiungere caratteri non presenti nella tastiera, possiamo andare su Mappa Caratteri e copiare il carattere per poi incollarlo ma non sempre si risolve. Ci sono però altre opzioni che vado a elencare:

1) Se ne conosciamo il codice ASCII, si inserisce lo stesso codice tra &# e ;. Per esempio il simbolo del paragrafo "" ha come codice ASCII 0182, quindi per inserirlo in una pagina web occorre incollarvi ¶.

2) Se si conosce il nome della Entità di un carattere, si può inserire in una pagina web con questa sintassi "&" +codice identificativo + ";". Per esempio ©  può essere usato per il simbolo del copyright ©. Per conoscere l'entità di un carattere non ASCII, va incollato in questo tool  e la sua entità verrà mostrata in basso

entità

3) Se si è trovato il codice Unicode del simbolo da inserire, per esempio di questo carattere speciale usato per i menù nei dispositivi mobili, allora lo possiamo inserire con questa sintassi &#Codice Unicode;. Nel caso in oggetto il codice Unicode è 0182 quindi la stringa da inserire è ¶. Il codice Unicode lo si può desumere anche dalla Mappa dei caratteri in basso sulla sinistra con il simbolo U+codice. Con questa stringa Î, ricavata dal primo screenshot dopo aver sostituito i due zero iniziali con x, si ottiene questo simbolo Î.




Nessun commento :

Posta un commento

Non inserire link cliccabili altrimenti il commento verrà eliminato. Metti la spunta a Inviami notifiche per essere avvertito via email di nuovi commenti. Se ti ho aiutato con il post o con le risposte ai commenti condividi su Facebook o su Twitter. Grazie.