Riferimenti a caratteri in HTMLdi Nicola VeledaSolitamente un documento HTML viene scritto utilizzando il set di caratteri ASCII. Talvolta è necessario inserire caratteri che non sono definiti in ASCII, come ad esempio le lettere accentate à, è, ì, etc., e per questo viene utilizzato il set di caratteri ISO Latin-1. Spesso invece si rende necessario inserire alcuni caratteri esterni al set di caratteri, come ad esempio la lettera greca beta (β) per le formule matematiche, caratteri grafici (•, ♥) e simboli commerciali (™, ©). Un metodo poco semplice ed elegante è quello di utilizzare il set di caratteri Unicode, che comprende tutti i simboli di qualsiasi lingua mondiale; il problema sta nel fatto che si dovrà codificare ogni carattere in più byte, raddoppiando la dimensione del file e rendendo il codice sorgente poco comprensibile. Un metodo migliore è quello fornito dai riferimenti a carattere, definiti nello standard SGML e quindi presenti anche in HTML: i caratteri esterni al set disponibile vengono codificati in due modi: riferimenti numerici e riferimenti ad entità. Riferimenti numerici — specificano la posizione di codifica di
un carattere, nell'insieme dei caratteri Unicode.
Riferimenti ad entità — specificano il nome simbolico
di un carattere, in un insieme limitato definito nello standard SGML.
I riferimenti ad entità distinguono caratteri maiuscoli da quelli minuscoli, così È codifica il carattere 'È' mentre è codifica il carattere 'è'. Esistono riferimenti ad entità carattere particolari, che dovrebbero essere utilizzati per codificare caratteri speciali in HTML, vale a dire i caratteri < e > che delimitano i tag, il carattere " che delimita le stringhe e il carattere & che introduce i riferimenti ad entità. Questi simboli, usati fuori dal loro contesto di caratteri speciali (ad esempio > come carattere matematico "maggiore di"), possono generare errori di codifica nei browser; per questo motivo i caratteri devono essere sostituiti con un riferimento:
È disponibile una tabella
completa dei riferimenti ad entità caratteri definiti per HTML,
in formato PDF.
Bibliografia: W3C — Character entity references in HTML 4
|