renciia transffe de caracteres interna acionales Internet y el correo electrónico en español. Soluciones a los problemas de la transferencia de caracteres internacionales Álvaro Ibáñez ([email protected]) Este artículo está dirigido a todas aquellas nico más comunes. El lector puede dirigir- personas que trabajan habitualmente con correo se directamente a esta parte (“La solución electrónico en Internet en cualquier plataforma: para comunicarse sin problemas”) si lo Windows, Macintosh, Unix, OS/2 u otras y que único que desea es saber cómo comunicar- sufren lo que popularmente se conoce como “el se sin quebraderos de cabeza, configuran- problema de los acentos”. Se denomina así colo- do correctamente su software. quialmente a los “errores” de transferencia por correo electrónico de caracteres internacionales, · La tercera parte añade algunos consejos y denominación que engloba las letras con tildes, ejemplos prácticos adicionales: cómo saber la eñe, y otros signos ortográficos y caracteres qué software está usando “la otra parte” propios del español y otros idiomas distintos del para resolver problemas y cómo dar solu- inglés. ción a otros pequeños detalles en la comu- nicación. Con el fin de explicar el problema y las solu- ciones, este artículo está dividido en tres partes que siguen a la introducción: INTRODUCCIÓN · La primera parte describe de forma técnica los orígenes del problema y los formatos La situación que trata este artículo no es (ASCII, SMTP, MIME) empleados en Inter- nueva: el lector muchas veces habrá recibido net. Es interesante para aquellas personas mensajes de otras personas convertidos en un a las que les gusta conocer el porqué de las galimatías, o, como respuesta a mensajes perfec- cosas e indagar en el funcionamiento del tamente escritos y enviados con todos sus acen- solftware y de Internet. tos y signos ortográficos, un “no puedo leer nada de lo que has enviado: está lleno de basura”. · La segunda parte explica de forma práctica cómo solucionar los problemas, con ejem- Ante la frustración de no recibir correctamente plos para los programas de correo electró- el correo (o enviarlo y que no se reciba bien), Autores científico-técnicos y académicos 31 renciia transffe de caracteres interna Internet y el correo electrónico en español acionales mucha gente opta por escribir sin acentos y pedir números y símbolos) de sólo 128 caracteres, a otras personas que así lo hagan. Grave error. numerados del 0 a 127. Esto se debe a que Esta actitud no sólo va contra todas las reglas de emplea sólo 7 bits, algo que parecía suficiente en la ortografía española, sino que supone una pér- la época en que se propuso el estándar. Mucha dida de tiempo, comodidad y calidad en la gente cree que el código ASCII tiene 256 carac- comunicación. Para la mayoría, es incómodo teres (numerados del 0 al 255, con los 8 bits que escribir sin acentos (y terrible leer del mismo componen un byte), pero lo cierto es que lo que modo). Pensando en otros, basta imaginar el tra- se denomina “ASCII puro” se compone de sólo 7 bajo que supone para un editor recibir sin acen- bits y 128 caracteres. tos, eñes y otros signos ortográficos los artículos para una revista o el texto de un libro de cientos El los 128 caracteres del código ASCII original de páginas. (también conocido como US-ASCII) se encuen- tran las letras del alfabeto inglés en mayúsculas y Aunque a veces parezca lo contrario, el minúsculas, los números y algunos signos comu- comúnmente llamado “problema de los acentos” nes (espacio en blanco, paréntesis, corchetes, es una situación que ya está resuelta por diversos suma y resta, dólar, porcentaje, etc.) además de estándares internacionales, al menos en sus dos otros que habitualmente sirven de control (retor- facetas más importantes: el correo electrónico y no de carro, tabulador, etc.). la World Wide Web. Si bien en la WWW casi nadie tiene proble- Cuando los ordenadores se volvieron interna- mas porque que el estándar HTML es muy claro cionales, se cayó en la cuenta que esos 128 en este aspecto, tanto en la publicación web caracteres no eran suficientes para trabajar con como en la lectura de páginas mediante progra- los signos de otros idiomas (tildes, signos espe- mas navegadores, en el correo electrónico son ciales como las interrogaciones o exclamaciones muchos los programas que se usan en diversas de apertura, letras como la eñe, la cedilla y plataformas y con distintos métodos de codifica- otras), de modo que los fabricantes comenzaron ción, lo cual puede llevar a confusión a las perso- a usar un conjunto de caracteres ASCII ampliado nas menos expertas. de 8 bits (256 caracteres) al que añadieron, en los 128 caracteres adicionales, todas las letras y Como cualquiera puede suponer, para que signos especiales de uso común en lenguas euro- todo funcione es necesario que la mayoría de los peas, como el español. usuarios de Internet, tanto los que envían men- sajes como los que los reciben, trabajen con soft- Por desgracia, en aquel momento no se ware que admita estos estándares. Por fortuna, el siguieron estándares únicos ni hubo una deci- software de correo electrónico que los acepta es sión clara internacional (ni la definición de cada vez más común y, en muchos casos, gratui- ASCII era perfecta e inmutable, como se vio to para cualquier plataforma informática. más adelante). Cada fabricante de ordenadores y software usó su propio código pseudo-ASCII en variaciones nacionales o de sistema operati- vo... sin pensar en los problemas que esto aca- El código ASCII y el origen del problema rrearía en el futuro, por ejemplo, en el conecta- Los ordenadores, y por extensión, Internet, han do mundo de Internet. trabajado desde casi sus orígenes con textos en el denominado código ASCII (American Standard Así, en la actualidad, el “ASCII extendido” de Code for Information Interchange, Código están- 256 caracteres de los PC es distinto en MS-DOS dar americano para el intercambio de informa- y en Windows (incluso entre Windows 95 y Win- ción). El código ASCII, como su propio nombre dows NT, que usa otra codificación más moder- indica, tuvo origen americano, más concretamente na, Unicode), distinto a su vez del “ASCII Macin- en el instituto ANSI. tosh” y con diferencias entre todos ellos, el ASCII Unix, el de algunos sistemas de IBM y desde Al contrario de lo que mucha gente piensa, el luego con otros muchos sistemas operativos anti- ASCII codifica un conjunto de caracteres (letras, guos y modernos. 32 Autores científico-técnicos y académicos renciia transffe de caracteres interna acionales Internet y el correo electrónico en español Este problema hace que al transferir mensajes En la actualidad, la comunidad informática de texto entre distintas plataformas (algo muy sigue trabajando en diversos estándares, tanto de común en Internet) en caso de usar códigos codificación de caracteres como de transferencia ASCII extendidos diferentes haya un problema de correo, que hagan posible una comunicación de legibilidad. Una letra como la “á” en Win- transparente entre diversos idiomas. La World dows puede corresponderse con “ñ” en Macin- Wide Web, por ejemplo, ha empleado el conjun- tosh, “ü” en MS-DOS o algo todavía más ininte- to ISO Latin-1 en la especificación del lenguaje ligible. Incluso entre ordenadores parecidos (un HTML desde sus orígenes. Con unas reglas cla- PC con MS-DOS y otro con Windows) pueden ras sobre su utilización ha significado un gran surgir estos problemas. paso adelante en este sentido: la WWW es real- mente universal, y muchos navegadores aceptan En la actualidad existen codificaciones de incluso otras modalidades más generales que caracteres internacionales mejorados, siendo los permiten conjuntos de caracteres más especiales más comunes el estándar ISO 8859-1 de 8 bits, todavía, como las variantes usadas en chino, también conocido como ISO Latin-1, o el Unico- hebreo y japonés. de (que emplea más bits y permite codificar caracteres adicionales de muchas más lenguas, Otros estándares cada vez de mayor implan- por ejemplo en Windows NT). tación hacen que en la actualidad sea posible comunicarse sin problemas independientemente del software y la plataforma que se esté utilizan- Internet y el correo electrónico do (MS-DOS, Windows, Macintosh u otras). Como suele suceder, muchas de estas pro- En Internet, punto de unión de todo tipo de puestas encuentran el beneplácito de los usuarios sistemas operativos, máquina e idiomas, un pro- y se hacen populares (especialmente, las de la blema añadido al de los diferentes códigos ASCII Internet Engineering Task Force [IETF], que es el funcionamiento del protocolo SMTP (Sim- desarrolla los estándares TCP/IP para Internet), ple Mail Transfer Protocol, Protocol de transfe- mientras que otras más globales, como el Unico- rencia de correo sencillo). El SMTP es la base del de, siguen evolucionando para proporcionar una correo Internet y lo que “mueve” los mensajes solución mejor y más global en el futuro. entre los buzones electrónicos POP3 que casi todo el mundo utiliza hoy en día en su conexión. El SMTP se desarrolló de forma que funcionara MIME: una solución práctica aceptando únicamente el código ASCII original de 7 bits (128 caracteres), sin tener en cuenta el En 1991 la IETF comenzó a desarrollar la caótico estado de los sistemas ASCII extendidos especificación MIME (Multi-Purpose Internet Mail o las alternativas. Extensions, Extensiones de correo Internet multi- propósito), una serie de convenciones dirigidas a Actualmente, el SMTP sigue aceptando como que se pudieran intercambiar a través de Internet base únicamente ASCII puro de 7 bits, por lo que todo tipo de archivos (texto, audio, vídeo, etc.) si se envía correo electrónico (texto) con letras o de forma transparente para el usuario. Una parte signos tecleables en el ordenador que estén fuera importante del MIME está dedicada a mejorar las del grupo de los 128 básicos (como letras con til- posibilidades de las transferencias de texto inter- des, la eñe, etc.) el servidor de correo simplemen- nacional por correo electrónico.
Details
-
File Typepdf
-
Upload Time-
-
Content LanguagesEnglish
-
Upload UserAnonymous/Not logged-in
-
File Pages11 Page
-
File Size-