I. Fundamentos
1. ¿Qué son los formatos de archivo implicados en la localización?
En general, un formato de archivo implicado en la localización se puede definir como el diseño y la organización de los datos de un archivo usado para la localización de componentes de software. Al usar herramientas de TAO y de software en un proyecto de localización, los formatos de archivo implicados en la localización se importan como achivos de origen al principio del proyecto. Con el fin de trabajar con los formatos de archivo de localización para localizar componentes de software, primero es necesario distinguir entre texto traducible y no traducible contenido en los archivos. Para ello, es importante considerar que según qué componentes del software se deban localizar (interfaz de usuario, sitios web, archivo de ayuda o documentación impresa), los formatos de archivo implicados en la localización pueden variar.
2. Tipos de formato de archivo implicados en la localización 2.1 Según los componentes de software
Los componentes de software (el software y la documentación) se crean usando distintas aplicaciones informáticas basadas en distintos lenguajes de programación. Como resultado, tienen formatos de archivo distintos. Por ejemplo, con las interfaces de usuario de software, los datos pueden comprender no sólo texto (datos localizables), sino también código de programa, código fuente o código de recursos, una secuencia de instrucciones escritas en un lenguaje de programación legible por el ser humano. En el caso de la documentación, como los sitios web y los archivos de ayuda, el texto traducibles puede estar enmarcado entre etiquetas de diseño. Algunos de los formatos posibles para los distintos componentes de software son: Software:
Archivos de programa: Archivos RC files y .exe procedentes de distintos entornos de programación, como Borland Delphi, Java, XML, .NET, Visual Basic o archivos en formatos de metalocalización como .po, XLIFF, etc. Archivos gráficos: .gif, .jpg, .tiff, .psd, .bmp, etc.
Documentación:
Documentación impresa: .fm, .indd, .doc, .rtf, etc. Archivos de ayuda: .chm, .hlp, .rtf, .html, etc. Páginas web: .xml, .html, .php, .js, .pl, etc.
Respecto a los datos, las diferencias entre los formatos de archivo de la localización para los componentes de software dependen de:
Qué datos se consideran relevantes para la localización Cómo se distinguen los datos relevantes para la localización de otros datos Cómo se almacenan los datos Cómo se usan los "transferibles" y las secuencias de escape
1
2.2 Según el desarrollo de software
2.2.1 Archivos de código fuente y archivos binarios Al desarrollar aplicaciones de software, hay más tipos de formatos de archivo implicados en la localización: archivos de código fuente y archivos binarios. Al escribir aplicaciones de software, los programadores usan conjuntos de archivos de código fuente (que contienen código de programación, código fuente y código de recursos, que se compilan a continuación para crear archivos de programa. Tanto los archivos de código fuente como los binarios son tipos de formatos de archivo implicados en la localización que contienen texto traducible. Archivos de código fuente: Estos archivos, también llamados archivos de código de recursos (archivos RC), contienen componentes de la interfaz de usuario (como menús y cuadros de diálogo) y podrían ser:
Basados en texto: En estos archivos de formato de texto sin formato, el texto traducible suele estar rodeado por código del programa (como especificaciones de cuadros de diálogo, etc.), que no deben cambiarse durante la traducción. Con el fin de traducir archivos de código fuente que consisten en texto sin formato, pueden usarse editores de texto, herramientas de memorias de traducción o una herramienta específicamente creada para la localización de software. Basados en HTML/XML: Estos archivos de código fuente basados en HTML o XML pueden editarse o traducirse con un editor de código fuente (herramienta de desarrollo de software utilizado para crear y editar archivos de código fuente), un editor de texto o una herramienta de memorias de traducción, usando un filtro que permita extraer texto traducible y proteger los elementos de código, p.ej. en la mayoría de los editores de los sistemas de MT y herramientas de localización.
Archivos binarios: Se trata de archivos ejecutables que contienen datos "codificados en formato binario (en secuencias de bytes) con fines de almacenamiento y procesamiento informáticos" (trad. de Wikipedia, 2007). Los archivos binarios se utilizan en los programas de ordenador para "ejecutar" las instrucciones de programa contenidas en ellos. Esto quiere decir que son archivos de programa compilados, y, al contrario que los archivos de código fuente, no pueden ser leídos por los seres humanos. Los archivos binarios sólo pueden traducirse con herramientas de localización de software o de memorias de traducción, que son capaces de extraer elementos localizables del código binario. Son ejemplos de archivos binarios los ejecutables (p.ej. .exe, .dll), los gráficos, los de audio y los comprimidos en formato .zip.
2.2.2 Diferencias estructurales
Respecto a su estructura, los archivos de código fuente y los binarios también se distinguen por su:
Estructura externa: Hay diferentes posibilidades para identificar y editar la información localizable sin destruir/corromper el formato, p.ej. para extraer los
2
elementos localizables, de forma que el traductor no manipula el código del programa Contexto, alcance, conceptos de programación: La información contextual que falte, la información incompleta o las reglas a seguir por los archivos de destino en los archivos de código fuente pueden ser distintos de los de los archivos binarios. Comunicación interna: Los elementos como los transferibles, las secuencias de escape y las etiquetas pueden ser distintos en los archivos de código fuente y los binarios.
2.2.3 Archivos de código fuente o binarios implicados en la localización El uso de archivos de código fuente o binarios en la localización tiene ventajas y desventajas que merece la pena mencionar: Archivos de código fuente Ventajas:
No hace falta ningún editor en especial -- casi cualquier editor puede editar este tipo de archivos No hacen falta herramientas caras (de localización de software) (estos archivos pueden traducirse usando herramientas de localización de software o de memorias de traducción). Después de la traducción, hay que compilar los archivos de código fuente, y quizás enlazarlos entre sí para formar una aplicación completa creada para el aseguramiento de la calidad.
Desventajas:
No es fácil mantener la visión de conjunto al traducir este tipo de archivos. Si no se usan herramientas, los traductores tienen que buscar todas las cadenas de texto traducibles. Sin herramientas específicamente concebidas para ello, los traductores no pueden ver el aspecto de la interfaz traducida. Si no se usan herramientas específicamente creadas para ello, hay un alto riesgo de que el traductore sobreescriba partes del programa. La información contextual (en particular, la relativa a la estructura) puede perderse si se presenta al traductor en forma de lista texto traducible extraído de los archivos de código, en particular si se hace en orden alfabético. Sin herramientas específicamente pensadas para ello, puede ser difícil (o incluso imposible) reconstruir esta información contextual del archivo original.
Archivos binarios Ventajas:
Como la mayoría de las herramientas de localización incluyen una opción WYSIWYG, los traductores pueden ver inmediatamente el aspecto de su traducción en la interfaz del software. Los archivos binarios contienen información contextual Es la mejor opción para prevenir hacer cambios por error en los archivos de código fuente en formato de texto (Esselink, 2000:59, Sachse, 2005:147).
3
Desventajas:
Hacen falta editores o herramientas especiales (como las herramientas de localización de software) para editar estos archivos.
3. Elementos localizables
Aunque ya hemos dado una visión general de los tipos de formatos de archivo implicados en la localización que existen, ahora nos concentraremos en dichos formatos de archivo, concretamente en los elementos localizables contenidos en tales formatos. Los elementos localizables en los formatos de archivo implicados en la localización de software (archivos de código fuente o archivos binarios) son los datos que forman la interfaz de usuario. Los siguientes son ejemplos de elementos de la interfaz de usuario que deben ser localizados:
Menús Cuadros de diálogo Teclas de acceso y atajos de teclado (teclas rápidas) Tablas de cadenas de caracteres Elementos gráficos
3.1 Menús
Menús
4
Se trata de listas de opciones que se muestran en la pantalla (en forma de menús emergentes o desplegables) en los que los usuarios pueden tomar decisiones. Son:
Barras de menú Opciones de menú Menús contextuales
3.2 Cuadros de diálogo
Se trata de pequeñas ventanas que se superponen al programa, en las que hay campos en los que el usuario puede introducir datos. Pueden contener pestañas, casillas de opciones, texto estático, listas, etc.
3.3 Teclas de acceso y atajos de teclado
También llamadas teclas rápidas, las teclas de acceso son combinaciones de teclas que permiten al usuario acceder a funciones en menús y submenús. Las teclas de acceso suelen ser fáciles de recorder, al incluir normalmente la primera letra de la función correspondiente. Esta aparece subrayada en la línea de menús, p.ej. la "S" en "Save"
5
("guardar"). Los atajos de teclado también son combinaciones de teclado usadas para acceder funciones en menús y submenús. La combinación de teclas es una abreviatura de la instrucción de la opción de menú. En nuestro ejemplo, se usa Ctrl+S como atajo de teclado de la instrucción Save ("guardar"). Cuando se localiza una aplicación de software, no suelen cambiarse los atajos de teclado, especialmente porque a menudo son comunes a otras aplicaciones. Sin embargo, las teclas de acceso sí que deben adaptarse a los nombres de las opciones respectivas en la lengua de destino.
3.4 Tablas de cadenas de caracteres
Tablas de cadenas de caracteres
Se trata de secuencias de símbolos, normalmente ordenadas en forma de tabla.
Mensajes del sistema Tooltips Texto de la barra de estado Opciones en los campos de listas Valores de las variables en los mensajes del sistema
6
3.5 Elementos gráficos
Elementos gráficos
Pueden ser:
Mapas de bits: Es el tipo de formato que suelen tener los gráficos en una interfaz de usuario. Los cursores y los iconos, por ejemplo, pueden estar en este formato. Las imágenes de mapas de bits tienen que localizarse, y esto puede hacerse con un editor gráfico convencional, como Adobe Photoshop o JASC Paint Shop Pro. Iconos: Se trata de pequeñas imágenes en la pantalla del ordenador que representan objetos o funciones para que las vea el usuario. Su finalidad es hacer el uso de los ordenadores más fácil, y son una de las características de los sistemas basados en interfaces gráficas de usuario. Cursores: Un cursor es el símbolo en la pantalla del ordenador que indica la posición de la entrada actual o el lugar en el que aparecerá el próximo carácter.
7
Formatos de archivo implicados en la localización
En la sección siguiente, se describen tres tipos de formatos de archivo propios de la localización, de acuerdo con sus características técnicas y los retos que suponen en el proceso de localización de software. Cubriremos:
Archivos RC, Archivos HTML y XML
Archivos RC
Definición Los archivos RC (archivos de Resource Script) son archivos de código fuente estándar en Windows. Normalmente, las aplicaciones de Windows se construyen de tal forma que un compilador de recursos crea un archivo de recursos binario (.res), enlazando un archivo de recursos ASCII (.rc) con un archivo compilado o ejecutable.
Características Los archivos RC normalmente están escritos en ASCII y por líneas, porque contienen líneas que terminan en un carácter de línea nueva (que indica el final de una línea de texto) o par de retorno de carro.
8
Ejemplo de datos contenidos en un archivo RC proveniente de un cuadro de diálogo
Entorno de desarrollo
Los archivos RC se usan en las aplicaciones Windows, que, a su vez, suelen haber sido desarrolladas en entornos de programación orientados a objetos como Visual C++, Visual Basic o un entorno de desarrollo basado en web como Java.
Retos
Los archivos RC contienen información localizable que normalmente procede de cuadros de diálogo, menús y tablas de cadenas de caracteres. Ahora examinaremos una serie de características de los archivos RC que plantean un reto a la localización.
Elementos localizables
Entre los elementos que pueden encontrarse en los archivos RC que pueden o deben ser localizados, están el texto, los botones, las cuestiones de tamaño, las fuentes y el tamaño de las mismas.
9
Ejemplo de elementos que pueden o deben ser localizados en los archivos RC: texto y botones (en rojo), cuestiones de tamaño, fuentes y el tamaño de las mismas (en azul)
Identificadores
Los identificadores o IDs son marcas usadas para distinguir elementos del programa específicos en todo el paquete de software. Los identificadores permiten realizar "conexiones" entre el código del programa y los recursos. Aunque los identificadores se usan muy frecuentemente en los archivos RC, su uso no es muy intuitivo. Realizar cambios en el formato de origen sin el asesoramiento técnico adecuado puede llegar a errores. Por tanto, los identificadores no deberán cambiarse durante la localización.
10
Ejemplo de identificadores (en verde) en un archivo RC
11
Transferibles
Los transferibles se utilizan, por ejemplo, cuando hay que generar un mensaje en pantalla de forma dinámica durante la ejecución. Un ejemplo puede ser el siguiente mensaje: "El documento %s contiene %d palabras", en el que, durante la ejecución del programa, se inserta el nombre del documento en lugar de %s y el número de palabras en lugar de %d. Los transferibles representan los parámetros o valores actuales que hay que insertar. En particular, los caracteres "%s" son transferibles sensibles a la ubicación, utilizados en C y C++. Esto significa que también "%" necesita una secuencia de escape, por ejemplo: "%%" en la cadena "%d %%" donde %d es el número porcentual (p.ej. 50) y %% representa el carácter "%" en un mensaje como "50 %".
Tablas de cadenas de caracteres
Uno de los retos al localizar tablas de caracteres en archivos RC es que la localización se realiza sin información contextual. Las únicas pistas son los identificadores (IDs), que no deben modificarse. Para reducir este problema, se pueden insertar comentarios para los traductores o localizadores en las tablas de cadenas.
Espacio
Respecto al espacio en la interfaz de usuario de un programa, podría suponer un gasto de tiempo enorme ajustarlo en los archivos RC si no se dispone de una herramienta de localización de software. Muy a menudo, los traductores/localizadores tienen que ajustar manualmente el tamaño del texto traducido que aparece en botones y cuadros de
12 diálogo usando un editor gráfico. Las herramientas de localización de software permiten acelerar este proceso.
Editor gráfico
Juegos de caracteres y fuentes
Al localizar las interfaces de usuario a idiomas como el ruso, el griego o el chino, el texto traducido no se muestra siempre en la pantalla en la manera que debería. Esto a menudo tiene que ver con los juegos de caracteres y fuentes utilizados. Los recursos binarios siempre se guardan en formato UNICODE. Sin embargo, los programas pueden estar escritos tanto en UNICODE como en una página de código concreta, porque, dependiendo del sistema operativo, las aplicaciones podrían no funcionar, p.ej. en MS Windows 9x/ME sólo funcionan las aplicaciones basadas en una página de código determinada. Si los juegos de caracteres y las fuentes no se muestran correctamente en la pantalla, esto no significa necesariamente que haya errores de localización. Siempre es buena idea probar el software en un sistema operativo localizado. Finalmente, para simplificar el flujo de trabajo, los localizadores deberían intentar usar las fuentes predeterminadas.
Archivos HTML Se trata de archivos de texto escritos en HTML (HyperText Markup Language), un lenguaje de formateado por etiquetas (un lenguaje de marcado) que tiene finalidades específicas y usa un conjunto de etiquetas predefinidas. En su origen, HTML fue desarrollado a partir de SGML (Standard Generalized Markup Language). El término hypertext en HyperText Markup Language se refiere al método de organizar texto o contenidos, de forma que ciertos elementos estén vinculados a otros, como sitios web, formularios interactivos, imágenes incrustadas y otros objetos (hipervínculos). Por tanto, el contenido no sólo puede leerse de forma lineal, sino también navegando por 13 diversos documentos y sitios yendo de un hipervínculo a otro. El término marcado se refiere al proceso de añadir información estructural y de formateado al texto mediante etiquetas predefinidas. Por ejemplo, estas etiquetas permiten la descripción de elementos estructurales en las páginas web como encabezados, tablas, gráficos, hipervínculos, etc. Las etiquetas HTML se usan para el formateado, indicando al navegador web cómo mostrar el texto o contenido. (cf. Zerfaß, 2005).
Entorno de desarrollo
HTML es el lenguaje de marcado más extendido para la creación de páginas web. Hoy en día, cuatro millones de páginas web activas están escritas en HTML, y este formato es comúnmente aceptado como formato estándar para escribir páginas web. En el ámbito de la localización de software, el HTML se ha convertido en el formato de archivo estándar para las páginas web y los archivos de ayuda. Al localizar, los formatos de archivo en HTML suelen ser traducidos con una memoria de traducción o una herramienta de localización de software. Para editar archivos HTML sin usar herramientas, debería usarse un editor apropiado, preferiblemente el mismo que se usó para crear los archivos originales (cf. Esselink 2000:175).
Características
Los formatos de archivo HTML consisten en etiquetas, encerradas por signos de "menor que" (<) y "mayor que" (>). Todos los archivos HTML comienzan con una etiqueta de apertura, , y una de cierre, . Estas etiquetas permiten la definición de la estructura del contenido, del diseño de página, del formato del texto, de la inserción de imágenes, etc. Etiquetas externas frente a internas En el formato de archivo HTML hay dos tipos de etiquetas: internas y externas. Las etiquetas internas están dentro de los segmentos traducibles (p.ej. en frases). Un ejemplo de etiquetas internas son las de apertura y cierre de texto en negrita. Las etiquetas externas se encuentran fuera de los segmentos traducibles, y permiten el marcado del contenido y el formateado de los párrafos (cf. Esselink, 2000:2007). Es importante para los
14 traductores/localizadores distinguir entre ambos tipos de etiquetas, ya que puede que hay que modificar las internas al traducir, mientras que las externas deben mantenerse tal cual. DTD En los formatos de archivo HTML, todas las etiquetas están predefinidas. Esto significa que hay un número concreto de etiquetas que pueden usarse en un documento dado. La especificación de las etiquetas que se pueden usar está contenida en la definición de tipo de documento (DTD), en la que también se especifican las reglas que debe seguir la estructura del documento (cf. Esselink, 2000:2007). Los documentos HTML también incluyen una declaración que especifica la versión de HTML y el tipo de documento. En la declaración, un documento HTML dado se "declara" válido de acuerdo con la DTD de HTML. Casi todas las ediciones actuales de herramientas de MT incluyen un archivo de ajustes para archivos HTML (p.ej. el archivo HTML4.ini de SDL TRADOS), que contiene reglas de segmentación predefinidas. Validación Con el fin de validar la conformidad de los documentos HTML con la norma, hay varias herramientas en Internet (analizadores sintácticos o "parsers") que comprueban la sintaxis del documento respecto a la DTD. Los documentos deberían validarse tras la localización, para verificar que todos los enlaces internos y externos funcionan y que no hay etiquetas corruptas. Algunos ejemplos de herramientas de validación en línea son www.htmlvalidator.com y www.linkbot.com (cf. Esselink, 2000:268).
Ejemplos de DTD
...
XML DTD schema example
Entidades: Las entidades HTML son cadenas de caracteres específicos que pueden tener funciones especiales. Por ejemplo, pueden utilizarse como "secuencias de escape" para representar caracteres extendidos que no están en el juego de caracteres estándar ASCII. El carácter que las introduce indica que los caracteres que siguen hay que interpretarlos de forma alternativa. Algunos ejemplos de caracteres extendidos y las secuencias de escape correspondientes son:
15
La entidad HTML utilizada para transcribir umlauts alemanes como "ä" es ä El carácter alemán "ß" se transcribe ß El carácter alemán "ç" se transcribe ç
Otros caracteres, como '&', '<' y '>' son parte de la sintaxis HTML. Cuando se desea utilizar estos caracteres de otra forma, por ejemplo, como parte del texto, hay que utilizar el mismo sistema. Por ejemplo:
"Ampersand" ('&') se transcribe & "Menor que" '<' se transcribe < "Mayor que" '>' se transcribe >
Ejemplo de caracteres extendidos alemanes con las correspondientes "secuencias de escape" en HTML
Retos
Los archivos HTML contienen código de programa, texto e información metatextual (formateado etc.) Distinguir estos elementos unos de otros plantea un auténtico reto a la localización. En general, los retos al localizar HTML están relacionados con los mismos elementos sintáticos de HTML mencionados en la sección anterior. Por ejemplo, en un documento HTML es posible encontrar documentos hipertextuales; texto, gráficos, archivos de sonido y vídeo; hojas de estilo, formularios, diseños y scripts que tienen que ser localizados o actualizados según cuál sea el mercado de destino. Algunas de estas particularidades de los documentos HTML que pueden suponer un reto para los traductores o localizadores son: Formularios: En HTML puede haber formularios, áreas de entrada de texto o listas de opciones. En este caso, el reto para los traductores y localizadores supone distinguir el texto de los formularios que debe ser traducido. El siguiente gráfico muestra la representación en HTML de un formulario con áreas de entrada de texto y listas para seleccionar opciones:
16
Formularios
Formato: En HTML, formatear se refiere a las especificaciones que definen cómo el texto va a aparecer. Por ejemplo, el tamaño, la familia y el color de la fuente, las indicaciones sobre tamaños y listas son elementos de formateado en HTML. Para los traductores y localizadores, es importante distinguir elementos de formateado, con el fin de modificarlas o adaptarlas según los requisitos del mercado de destino.
Elementos de formateado como la familia, el tamaño, el color y el tamaño de la fuente en el texto HTML
Scripts incrustados: Los scripts son "instrucciones para otros ordenadores", dicho de otra manera: lenguajes de programación que pueden ser interpretados por un ordenador e introducidos por un ser humano usando un teclado. Un script muy extendido en la creación de websites es el JavaScript. Este tipo de script suele estar incrustado y permite el acceso a los objetos de otras aplicaciones. Uno de los retos que plantean los scripts incrustados a los traductores/localizadores es distinguir el subconjunto de datos incrustados: los lugares en los que los datos incrustados comienzan y terminarn, y dónde se encuentra el texto traducible. Por ejemplo, dada la siguiente aplicación JavaScript y su correspondiente código fuente:
17
Alerta en JavaScript
Código fuente en JavaScript
El script incrustado contiene, obviamente, información traducible (en verde).
Archivos XML Definición
Se trata de archivos escritos en XML (eXtensible Markup Language). El XML es un lenguaje d emarcadao que combina texto e información relacionada. Una de sus finalidades principales es facilitar el intercambio de datos entre distintos sistemas de información, en particular a través de Internet. Como el HTML, el XML fue desarrollado originalmente a partir de SGML (Standard Generalized Markup Language). Fue diseñado para ser más fácil de analizar sintácticamente y de procesar que el SGML, y se considera una simplificación del SGML, destinado a aplicaciones de uso general, como el web.
Entorno de desarrollo
Hoy en día, el XML juega un papel creciente en la gestión de datos, al ser "una de las formas más seguras, más potentes y flexibles de almacenar, manipular, localizar y presentar datos en distintos idiomas" (Savourel, 2005). Es por ello que se ha convertido en un compnente importante en ámbitos tales como la internacionalización y la 18 localización. En la localización, por ejemplo, se usa el XML a menudo, independientemente de si el proyecto de localización hay implicados componentes en XML o no. Los archivos XML pueden usarse como archivos de recurso para la localización, y casi todas las herramientas de localización de software trabajan con formatos XML.
Visión de los datos de XML como formato de recursos
Al localizar, los formatos de archivo en XML suelen ser traducidos con una memoria de traducción o una herramienta de localización de software. Para editar formatos de archivo XML sin herramienta, deberá usarse un editor adecuado. Aunque los ámbitos de uso del XML más comunes son la documentación y los sitios web, también puede encontrarse XML en las interfaces de usuario, las capas de transferencia de datos, los mecanismos de exportación/importación de bases de datos y los gráficos. También se usa el XML como formato de intercambio, p.ej. entre distintas aplicaciones como bases de datos, procesadores de textos, hojas de cálculo, etc.
Características
El XML permite la representación estructurada de contenidos y relaciones, separando contenido y forma.
19
Ejemplo de visión de la estructura de un documento XML
Como en HTML, la estructura XML consiste en etiquetas (encerradas entre signos < >) y texto. Cada elemento XML viene marcado por una etiqueta de apertura y otra de cierre, y puede contener texto u otros elementos. Las etiquetas tienen nombres de atributos y pueden contener además atributos, que, a su vez, están compuestos de nombres de atributo y valores, pudiéndose definir ambos libremente. En un documento XML bien escrito, las etiquetas no se solapan, y todas las etiquetas están cerradas. Al contrario que ocurre en HTML, en que los nombres de todas las etiquetas están predefinidos, en XML se pueden definir etiquetas a placer.
UNICODE Una de las razones que hacen que XML esté tan extendido en la industria de la localización y la internacionalización es que el juego de caracteres Unicode de los documentos XML puede incluir caracterers en la mayoría de las lenguas utilizadas hoy en día (cf. Savourel, 2005). Entidades Como en HTML, en XML algunos de los caracteres que corresponden a la sintaxis XML tienen que ser representados con "secuencias de escape", es decir, ser sustituidos por entidades. Por ejemplo, el signo "menor que" "<" debe representarse "<" y el de "mayor que" ">" con ">". Los caracteres extendidos pueden ser tratados de la misma forma en XML. De esta forma, los documentos XML pueden contener caracteres de cualquier tipo, aun cuando la codificación del documento no sea compatible con ellos. Como ejemplo, la letra griega Omega (Ω) puede sustituirse por Ω o Ω, si el documento usa una codificación incompatible con el alfabeto griego (cf. Savourel, 2005). DTD Como en el caso de los archivos HTML, los archivos XML también tienen una definición del tipo de documento (DTD) que contiene información sobre las funciones y las interdependencias jerárquicas de las etiquetas, la estructura, etc. Sin embargo, en
20 contraste con lo que ocurre con las etiquetas HTML, las de XML no están predefinidas. Por tanto, la DTD describe el archivo XML mediante restricciones de la estructura. Contiene las etiquetas y los atributos permitidos en el documento XML y describe algunas construcciones que no son imprescindibles para establecer la estructura, pero que pueden afectar la interpretación de algunos documentos. Cuando la estructura de un documento XML se corresponde con el esquema DTD definido previamente, el documento XML se considera "válido".
Retos
Los retos que plantea la localización de archivos XML están relacionados con la complejidad natural de los archivos XML. DTD: Para los localizadores y los traductores, puede ser difícil obtener el archivo DTD de los clientes. Algunas de las versiones de los sistemas de memorias de traducción (p.ej. en el caso de SLD TRADOS, todas las versiones anteriores a SDL TRADOS 7) necesitan, para traducir archivos XML, el archivo que contiene la DTD, para poder crear el archivo de configuración (en TRADOS, el archivo *.ini), que especifica las reglas de segmentación que se utilizará en el documento XML en particular. De otro modo, hay que crear el archivo de configuración haciendo una lista de las etiquetas y sus funciones manualmente.Algunas versiones recientes de herramientas de memorias de traducción o localización no necesitan forzosamente el archivo DTD, pero tienen sus propios mecanismos para analizar y extraer las etiquetas XML del documento XML, creando así el archivo de configuración de manera semiautomática (el usuario aún puede hacer ajustes). Estructura cambiante: A menudo, la localización de archivos en XML puede ser muy compleja, porque las estructuras cambian, y puede ser difícil determinar qué elementos son localizables.
Distintas estructuras para los mismos datos en XML
Hay distintas posibilidades de estructurar XML como formato de recursos. En estos dos ejemplos, la misma información se presenta con dos estructuras distintas. Por ejemplo, en el primero, todos los valores de los identificadores y los datos traducibles están incrustados directamente entre la etiqueta de apertura y la de cierre correspondiente. En el segundo, los valores de los identificadores están incrustados en la subentidad XML, y los datos traducibles en la subentidad XML, ambas subordinadas a la entidad.
21
XML en el proceso de localización
Situación 1: XML como fuente de datos temporal En esta situación, el formato XML se usa como puente para la localización. Usando filtros especiales, los datos para localizar pueden convertirse, extraerse o mezclarse del formato propietario del desarrollador de la aplicación o del autor de la documentación a un formato XML que será utilizado durante la localización. Después, los archivos XML localizados serán convertidos de nuevo al formato propietario del desarrollador de la aplicación o del autor de la documentación.
Situación 1
Situación 2: XML como fuente de datos alternativa En este escenario, los archivos de origen están en formato XML y tienen que ser traducidos primero y luego convertidos al formato propietario del desarrollador de la aplicación o del autor de la documentación, mediante una herramienta de conversión. De esta forma, no son necesarios datos de extracción o conversión antes de la localización, y es posible conservar las ventajas de proveer datos en XML a los localizadores.
Situación 2
Situación 3: XML como fuente de datos original En este caso, los archivos para localizar son entregados por el desarrollador de la aplicación o el autor de la documentación en formato XMl. No hará falta, por tanto, convertir los archivos antes ni después del proceso de localización.
22
(Gráficos tomados de Savourel, 2005)
Situación 3
HTML frente a XML ¿Qué futuro tienen HTML y XML? En los últimos años, XML ha cobrado importancia hasta el punto de que muchos afirman que está retando el papel de líder que el HTML tuvo hasta ahora. Algunos de los argumentos utilizados en favor de XML tienen que ver con las limitaciones de HTML, por ejemplo:
HTML consiste en un catálogo fijo de etiquetas y sólo describr documentos de un tipo en concreto Los datos en HTML son difíciles de procesar para los navegadores Los documentos HTML utilizados como aplicaciones acaban creando cuellos de botella aumentando el tráfico entre cliente y servidor
Sin embargo, no es realista pensar que el HTML se convertirá en relevante de pronto, especialmente si se tiene en cuenta el número de páginas útiles en activo que hay en Internet hoy en día. Hay algunas propuestas para conservar el HTML y encontrar una forma de integrarlo con el XML. La idea es apoyar la inclusión y el proceso de datos en XML, bien delimitados y definidos, en documentos HTML. Esta estrategia permitirá:
que el contenido suministrado al web se enriquezca y apoyar futuras mejoras en los modelos de contenido basados en XML que los desarrolladores de contenido puedan confiar en las capacidades probadas y conocidas de HTML mientras experimentan con XML en sus entornos
(Adaptado de "XML: It's the Future of HTML")
Formatos de archivo en la metalocalización
Los formatos de metalocalización fueron diseñados especialmente para ayudar en el proceso de localización. Son formatos de recursos que pueden contener información sobre diversos formatos de recursos, así como información adicional. Algunas de las razones de mezclar formatos de recursos son:
23
Uso paralelo de distintos entornos de desarrollo, por ejemplo, recursos en diferentes formatos de recurso (p.ej. el caso del formato de archivo .po) Minimización del número de formatos de localización en el flujo de trabajo, por lo que se usan metaformatos (p.ej. XLIFF)
Definición XLIFF (XML Localization Interchange File Format) es un formato estándar basado en XML diseñado para guardar texto extraído de archivos similares al software y documentos con etiquetas. XLIFF fue desarrollado a finales de 2000 por un grupo de compañías, entre las cuales estaban Oracle, Novell, Sun e IBM/Lotus, con el objetivo de definir una especificación extensible para el intercambio de información de localización. Como los formatos de localización pueden variar en su estructura, el uso de juegos de caracteres, las marcas sustitutivas, las secuencias de escape, el formateado, etc., se creó XLIFF para unificarlas todas en un solo formato, independientemente de herramientas de localización específicas.
Ejemplo de un archivo XLIFF
Las siguientes características son propias de XLIFF:
El contenido se describe en forma de esquema, atendiendo a los elementos, sus atributos y su uso. El gráfico siguiente muestra un ejemplo de un esquema XLIFF:
24
Esquema XLIFF
El elemento más importante en la estructura XLIFF es la
Ejemplo de elementos de una
Es posible incluir información adicional.
25
Se usa como formato de localización nativo (p.ej. en Macromedia Flash).
En los archivos XLIFF también hay
Traducciones alternativas. En nuestro ejemplo, los térmions en alemán Extras y Optionen equivalen al inglés Options.
Comentarios para traductores o localizadores
26
Leyendas con información para traductores o localizadores
Leyendas 27
Flujos de trabajo
Flujo de trabajo típico en la localización sin XLIFF En un flujo de localización típico sin XLIFF, habiendo aplicaciones del desarrollador en varios archivos, cada uno en un formato distinto, la localización puede resultar compleja. Con el fin de preparar todos estos archivos para la localización, los gestores de proyecto o localizadores tendrán que usar los filtros de recurso de la herramienta para convertir los archivos a un formato apropiado, de forma que los archivos puedan ser editados y traducidos por traductores usando la herramienta especificada por el cliente (si la indica).
Flujo de trabajo típico en la localización sin XLIFF (Fuente: OASIS)
Flujo de trabajo en la localización con XLIFF En un flujo de trabajo típico en la localización con XLIFF, el proceso de localización se simplifica, porque hay menos pasos en el proceso de localización. Por una parte, las aplicaciones del desarrollador que se van a localizar podrían estar disponibles en el formato XLIFF. En este caso, no hace falta pre-proceso, y los recursos traducibles pueden editarse directamente y ser traducidos utilizando un editor compatible con XLIFF o las herramientas apropiadas de memoria de traducción o localización. Si, por otra parte, las aplicaciones del desarrollador que se van a localizar son proporcionadas en un formato distinto a XLIFF los archivos (p.ej. HTML, RC, Java, etc.) deben ser preprocesados y convertidos al formato XLIFF. Una vez que estén en XLIFF, los recursos traducibles pueden editarse directamente y ser traducidos utilizando un editor compatible con XLIFF o las herramientas apropiadas de memoria de traducción o localización. (Gráficos tomados de Oasis)
28
Flujo de trabajo en la localización con XLIFF (Fuente: OASIS)
Hoy en día, las herramientas de localización de software han ampliado la cantidad de formatos de archivo con los que son compatibles. Son compatibles con formatos tales como:
Archivos binarios de recursos estándar de Windows (de 16 y 32 bits) (archivos EXE, DLL, SYS) y RC) Archivos binarios de Microsoft Visual Basic 6 Archivos XML, incluido XLIFF HTML Archivos de Microsoft Installer (MSI) Archivos de texto monolingües
Algunas herramientas son compatibles con otros formatos de archivo, a través de add- ins. Se trata de pequeños programas escritos para extender ciertas características a las herramientas de localización de software. Algunos add-ins opcionales para otros formatos de archivo son:
Archivos binarios de recursos de Microsoft .NET (EXE, DLLs satélite y ensamblados), archivos de recursos (RESX y RESOURCE), compatibilidad con cuadros de diálogo heredados (WYSIWYG), compatibilidad con controles y propiedades personalizados, compatibilidad de todos los marcos .NET Archivos binarios de recursos de Borland Delphi / C++ Builder (EXE, DLL, BPL)
29
Java (todas las plataformas: Archivos J2EE, J2SE y J2ME), archivos de propiedades (PROPERTIES), archivos de código fuente (JAVA), archivos binarios (CLASS), archivos de proyecto Java (JAR)
Formatos de archivo compatibles adicionales:
Analizador sintáctico de bases de datos ODBC o MS Access, MS Excel o MS SQL Server o Oracle o IBM DB2 Palm OS Parser .Analizador sintáctico po
30
Introducción.
HTML significa HyperText Markup Language. Es el lenguaje en que se escriben los millones de documentos que hoy existen en el World Wide Web. Cuando accedemos a uno de estos documentos, el cliente (Netscape, IE, Mosaic, Lynx, IBrowse) los interpreta y los despliega. Existen clientes gráficos como Netscape, y otros como el Lynx que solo despliegan texto. Es muy importante no olvidar esto cuando se diseña una página web. Crear una buena página tiene dos aspectos; por un lado el conocimiento técnico para crear código HTML correcto, por otro lado el claro diseño para presentar la información.
El objetivo de este texto es proporcionar un conocimiento básico acerca de la construcción y manejo de etiquetado para la ingeniería aplicada a la traducción de páginas Web y dispositivos móviles, para un conocimiento más profundo de este lenguaje posteriormente se desarrollarán más versiones de este texto, por el momento esperamos que la información aquí proporcionada le sea de utilidad.
Etiquetas de muestra
Los archivos con etiquetas son archivos en los que la disposición o la estructura de la información aparece separada del texto o del contenido y almacenada en códigos que rodean a los elementos de texto. Por ejemplo, las páginas web están codificadas por medio de un sistema de etiquetas llamado HTML (HyperText Markup Language).
Este ejemplo muestra parte de un documento HTML con etiquetas que rodean a los elementos de texto. Las etiquetas contienen información estructural que identifica distintas partes del documento web (p.ej. el título o los encabezamientos). Al traducir documentos como este, el traductor tiene que tener cuidado de no cambiar, sobreescribir
31 o eliminar estas etiquetas, porque los navegadores de Internet las necesitan para mostrar el documento web correctamente.
Etiquetas de protección
A través de un proceso de traducción mediante sistemas de MT, es una tarea importante del editor ser capaz de proteger todas las etiquetas para que no puedan ser eliminadas o modificadas por el(/los) traductor(es). Algunos sistemas lo hacen escondiendo totalmente las etiquetas en el editor, y proporcionando una vista previa del documento web en la lengua de destino, como se muestra en la captura de pantalla del programa across.
Etiquetas como marcas sustitutivas
En otros sistemas, sin embargo, las etiquetas son reemplazadas por marcas sustitutivas en el editor. En DéjàVu, por ejemplo, se representan como números entre corchetes (llamados "códigos incrustados"), lo que significa que hay alguna etiqueta en el
32 documento original. El usuario puede elegir cómo desea que se muestre el significado de estos códigos incrustados.
Según el sistema utilizado, el traductor puede mostrar todas las etiquetas e incluso modificarlas, aunque no fuera recomendable. En un sistema como DéjàVu, es imposible exportar el proyecto sin que todos los códigos sean insertados en los segmentos correspondientes. En tales casos, el sistema alertará al usuario y mostrará el segmento exacto en el que falta un código. El usuario tendrá que volver e insertar los códigos que faltan para poder realizar la exportación.
Etiquetas en Trados
En el TagEditor de Trados, las etiquetas se muestran bien en forma abreviada o completa, y pueden ser desplazadas, editadas o eliminadas durante la traducción. Si es necesario, el traductor también puede añadir una etiqueta.
Es importante saber que hay etiquetas externas e internas:
Las etiquetas externas tienen, de forma predeterminada, un borde negro; por ejemplo la etiqueta HTML Normalmente representan información estructural. Estas etiquetas se ignoran completamente junto con su contenido durante el proceso de traducción y sólo pueden aparecer fuera de las frases. Rara vez es necesario mover o borrar las etiquetas externas durante la traducción. Las etiquetas internas presentan un borde rojo, de forma predeterminada; por ejemplo la etiqueta B. Estas etiquetas pueden representar información acerca del 33
formato (como el formato de fuente negrita), rodear hipervínculos u otras marcas, y pueden aparecer dentro del texto. La mayoría de las etiquetas internas se pueden desplazar dentro de la frase para ajustarse a la traducción. Dependiendo del formato de archivo, se pueden añadir o borrar etiquetas internas, si es necesario. De forma predeterminadad, el TagEditor considera las etiquetas desconocidas como internas. Cuando las etiquetas contienen texto que no sea información acerca de la estructura o el formato, TagEditor clasifica el contenido del texto bien como traducible o bien como no traducible.
Convertir formatos de archivos con etiquetas
Con el fin de importar/convertir algunos formatos de archivo con etiquetas como HTML, o archivos con etiquetas creados por filtros de importación desde formatos de autoedición como FrameMaker, InDesign etc., las herramientas de MT suelen ser capaces de reconocer las etiquetas utilizadas en estos formatos. Sin embargo, para los archivos cuyo formato incluye etiquetas definibles por e autor del texto en la lengua de origen, p.ej. XML, el traductor tiene que configurar filtros él mismo, bien a partir de una Definición de Tipo de Documento (DTD) provista por el cliente, o analizando los archivos y determinando la función de las etiquetas, p.ej. si se usan para delimitar segmentos o para hacer que ciertos elementos del texto no sean traducibles.
34
35
Mapa de los lenguajes de marcas
Principales GML --> SGML --> XML --> Dialectos XML
Documentos en general Lenguajes Lenguajes Lenguajes de Lenguajes ligeros descriptivos para manuales presentación ASN.1 Rich Text BBCode DocBook EBML Format Markdown HelpML YAML S1000D ReStructuredText LinuxDoc TeX setext POD troff Textile Microsoft HTML Wikitexto Assistance ML
Tecnologías de internet World Wide Interfaz de Sindicación Servicios web Web usuario HTML GladeXML Atom WSDL XHTML MXML RSS XINS Wireless ML (Macromedia) ICE WSCL Handhelp User Interface OPML y WSFL ML ML OML XML-RPC RDF XAML and SyncML Webml Meta Content MyXaml Framework XForms XUL / XBL
Lenguajes especializados
Gráficos 2D: SVG, CGM, VML, InkML. Gráficos 3D: VRML/X3D, STEP. Matemática: MathML y OpenMath. Música: LilyPond y MusicXML. Taxonomía: DITA Finanzas: eXtensible Bussiness Reporting Language, Financial products ML. Geomática: Geography ML. Aeronáutica: Spacecraft ML. Multimedia: Synchronized Multimedia Integration Language. Voz: VoiceXML. Mensajería instantánea: XMPP. Videojuegos: BulletML, COLLADA.
36
1. Estructura de un Documento HTML
Una página web es un archivo de texto, se puede crear con cualquier editor de texto como el edit de DOS. El principio esencial del lenguaje HTML (HyperText Markup Language) es el uso de las etiquetas (tags). Funcionan de la siguiente manera:
Este es el cierre de una etiqueta.
Las letras de la etiqueta pueden estar en mayúsculas o minúsculas, indiferentemente. Por claridad, se usarán en este texto sólamente las mayúsculas.
Lo que haya entre ambas etiquetas estará influenciada por ellas. Por ejemplo, todo el documento HTML debe estar entre las etiquetas y :
[Todo el documento]
El documento en sí está dividido en dos zonas principales:
El encabezamiento, comprendido entre las etiquetas
y El cuerpo, comprendido entre las etiquetas yDentro del encabezamiento hay información del documento, que no se ve en la pantalla principal, principalmente el título del documento, comprendido entre las etiquetas
Dentro del cuerpo está todo lo que queremos que aparezca en la pantalla principal (texto, imágenes, etc.)
Por tanto, la estructura queda de esta manera:
37
[Aquí van las etiquetas que visualizan la página]
Antes de crear nuestra primera página, unas consideraciones sobre el texto:
Cuando escribimos en el documento el texto que queremos que aparezca en la pantalla, veremos que éste se acomoda a ella, sin que tengamos que pulsar el retorno del carro. Si queremos separar el texto en distintos párrafos debemos usar la etiqueta
, (que no tiene su correspondiente etiqueta de cierre
) . El texto puede tener unas cabeceras, comprendidas entre las etiquetas
y
,y
, etc. (hasta el número 6), siendo el número indicativo del tamaño. El tamaño mayor es el correspondiente al número 1. Puedes experimentar en el ejemplo que sigue, cambiando el número para comprobar el efecto que se logra.Una etiqueta muy interesante es la de centrado
También tenemos los separadores (horizontal rules), que se consiguen con la etiqueta
(no existe la correspondiente de cierre). Con ella se obtiene una raya horizontal tan ancha como la pantalla, y con la apariencia de estar embutida sobre el fondo, como se puede observar a continuación:
Práctica 1.
En el procesador de texto copiamos lo siguiente:
Primera pagina
38
Esta es mi primera pagina, aunque todavia es muy sencilla. Como el lenguaje HTML no es dificil, pronto estare en condiciones de hacer cosas mas interesantes.
Aqui va un segundo parrafo.
Guardamos el fichero en el procesador de textos con el nombre de mipag1.html y lo cargamos en el navegador. Este será el resultado.
2. Dando forma al texto
Como hemos visto en el ejemplo del epígrafe anterior, cuando queremos poner un texto sin ninguna caracterísca especial, lo ponemos directamente. Unicamente, la separación entre párrafos (dejando una línea en blanco) la conseguimos con la etiqueta
.
Si queremos separar los párrafos, o cualquier otra cosa, pero sin dejar una línea en blanco, usamos una etiqueta parecida
(break, o romper). Tampoco tiene etiqueta de cierre.
Si queremos obtener múltiples líneas en blanco no basta con repetir la etiqueta
, sino que hay que combinarla con la etiqueta
. Así por ejemplo, si queremos obtener cuatro líneas en blanco, pondríamos:
39
Al escribir el texto, si ponemos más de un espacio en blanco entre dos palabras observamos que el navegador sólo reconoce uno de ellos. Si queremos forzarle a que lo haga, debemos poner el código " " (non-breaking space).
Para destacar alguna parte del texto se pueden usar:
y para poner algo en negrita (bold). y para poner algo en cursiva (italic).
Otra etiqueta interesante es
y. El texto que se encuentre entre ella estará preformateado, es decir que aparecerá como si hubiera sido escrito con una máquina de escribir, con una fuente de espaciado fijo (tipo Courier). Además se respetarán los espacios en blanco y retornos del carro, tal como estaban en nuestro documento HTML (lo cual no ocurre normalmente, como hemos visto anteriormente). Es muy apropiada para confeccionar tablas y otros documentos similares.
Con la etiqueta y conseguimos también que el texto tenga un tamaño menor y la apariencia de los caracteres de una máquina de escribir (typewriter).
La diferencia con la anterior es que no preformatea el texto, sino que únicamente cambia su apariencia.
La etiqueta
yse utiliza para destacar una cita textual dentro del texto general.
En las fórmulas matemáticas puede interesar poder escribir índices y subíndices, que se consiguen con las etiquetas y respectivamente. Así, por ejemplo: m2 se consigue de la siguiente manera: m2 vx se consigue con: vx
A menudo nos interesará presentar las cosas en forma de listas. Podemos escoger entre tres tipos distintos:
1.Listas desordenadas (no numeradas) 2.Listas ordenadas (numeradas) 3.Listas de definición.
Las listas desordenadas (unordered lists) sirven para presentar cosas que, por no tener un orden determinado, no necesitan ir precedidas por un número. Su estructura es la siguiente:
- Una cosa
- Otra cosa
40
- Otra más
- Etc.
Es decir, toda la lista está dentro de la etiqueta
- y
Se puede anidar una lista dentro de otra. Por ejemplo:
- Mamíferos
- Peces
- Sardina
- Bacalao
- Aves
Las listas ordenadas (ordered lists) sirven para presentar cosas en un orden determinado. Su estructura es muy similar a la anterior. La diferencia estriba en que en el resultado aparecerá automáticamente un número correlativo para cada cosa.
- Primera cosa
- Segunda cosa
- Tercera cosa
- Etc.
Al igual que las listas desordenadas, también se pueden anidar las listas ordenadas.
El tercer tipo lo forman las listas de definición. Como su nombre indica, son apropiadas para glosarios (o definiciones de términos). Toda la lista debe ir englobada 41 entre las etiquetas
- y
1. El nombre de la cosa a definir , que se consigue con la etiqueta
- Una cosa a definir
- La definición de esta cosa
- Otra cosa a definir
- La definición de esta otra cosa
Comentarios no visibles en la pantalla
A veces es muy útil escribir comentarios en el documento HTML sobre el código que escribimos, que nos pueden servir para recordar posteriormente sobre lo que hicimos, y que no queremos que se vean en pantalla.
Esto se consigue encerrando dichos comentarios entre estos dos símbolos:
Ejemplo:
Práctica 2
En el procesador de textos copiamos:
Mis aficiones
Sin un orden particular, mis aficiones son las siguientes:
- El cine 42
- El deporte
- Natacion
- Baloncesto
- La musica
- El rock
- El jazz
- La musica clasica
Guardamos el fichero de texto con un nombre cualquiera y la extensión .html y lo cargamos en el navegador.
Este es el resultado.
3. Enlaces con otras páginas
La característica que más ha influido en el espectacular éxito del Web (o tela de araña) ha sido, aparte la de su carácter multimedia, la posibilidad de unir los distintos documentos repartidos por todo el mundo por medio de enlaces hipertexto.
43
Estructura de los enlaces
En general, los enlaces tienen la siguiente estructura:
yyy donde xxx es el destino del enlace (Obsérvese las comillas). yyy es el texto indicativo en la pantalla del enlace (con un color especial y generalmente subrayado)
Tipos de enlaces
Vamos a distinguir cuatro tipos de enlaces:
a) Enlaces dentro de la misma página b) Enlaces con otra página nuestra c) Enlaces con una página fuera de nuestro sistema d) Enlaces con una dirección de email a) Enlaces dentro de la misma página A veces, en el caso de documentos (o páginas) muy extensos, nos puede interesar dar un salto desde una posición a otra determinada. En este caso, lo que antes hemos llamado XXX, es decir, el destino del enlace, en este caso el sitio dentro de la página a donde queremos saltar, se sustituye por #marca (la palabra marca puede ser cualquier palabra que queramos). Lo que hemos llamado antes YYY es la palabra (o palabras) que aparecerán en la pantalla en color (en forma de hipertexto). Su estructura es, entonces: YYY
Y en el sitio exacto a donde queremos saltar, debemos poner la siguiente etiqueta:
Por ejemplo, si quiero saltar desde aquí a la pantalla final, pongo la siguiente etiqueta:
Y en el final del documento he puesto esta otra etiqueta:
b) Enlaces con otra página nuestra
Puede ser que tengamos una sola página. Pero lo más frecuente es que tengamos varias páginas, una inicial (o principal) y otras conectadas a ella, e incluso entre ellas mismas. Supongamos que queremos enlazar con la página creada en el ejemplo del epígrafe anterior, que la hemos llamado mipag2.html. En este caso, simplemente sustituimos lo que hemos llamado XXX (el destino del enlace) por el nombre del fichero:
44
Si queremos que vaya a un sitio concreto de otra página nuestra en vez de ir al principio de la página, adonde va por defecto, en ese sitio tenemos que colocar una marca (véase la sección anterior), y completar el enlace con la referencia a esa marca.
Una observación importante: Estoy suponiendo que la página en la que estoy escribiendo esta etiqueta y la otra página a la que quiero saltar están en el mismo directorio. Porque pudiera ocurrir que he organizado mi sitio del Web con un directorio principal, y otros subdirectorios auxiliares. Si la página a la que quiero saltar está, p. ej. en el subdirectorio subdir, entonces en la etiqueta tendría que haber puesto "subdir/mipag2.html".
Y a la inversa, si quiero saltar desde una página a otra que está en un directorio anterior, en la etiqueta tendría que haber puesto "../mipag2.html". Esos dos puntos hace que se dirija al directorio anterior. Obsérvese que se debe utilizar el símbolo / para indicar los subdirectorios, y no este otro \, que es propio únicamente de Windows.
Si nos queremos evitar todas estas complicaciones, podemos tener todo junto en un único directorio, pero esto tiene el inconveniente de que esté todo más desordenado, y sean más difíciles de hacer las futuras modificaciones.
c) Enlaces con una página fuera de nuestro sistema
Si queremos enlazar con una página que esté fuera de nuestro sistema (es decir, que esté en un servidor distinto al que soporta nuestra página), es necesario conocer su dirección completa, o URL (Uniform Resource Locator). El URL podría ser, además de la dirección de una página del Web, una dirección de ftp, gopher, etc.
Una vez conocida la dirección (o URL), lo colocamos en vez de lo que hemos llamado anteriormente xxx (el destino del enlace). Si queremos enlazar con la página de Netscape (cuyo URL es: http://home.netscape.com/), la etiqueta sería:
Es muy importante copiar estas direcciones correctamente (respetando las mayúsculas y minúsculas, pues los servidores UNIX sí las distinguen) d) Enlaces con una dirección de email
En este caso, sustituimos lo que se ha llamado antes xxx (el destino del enlace) por mailto: seguido de la dirección de email. La estructura de la etiqueta es:
Es decir, es conveniente poner también en el texto del enlace la dirección de email.
Práctica 3. 45
En el procesador de textos copiamos:
Mis paginas favoritas
Estas son mis paginas favoritas:
Guardamos el fichero de texto con el nombre mipag3.html y lo cargamos en el navegador. Este es el resultado:
4. Imágenes
La etiqueta que nos sirve para incluir imágenes en nuestras páginas del Web es muy similar a la de enlaces a otras páginas, que hemos visto en el epígrafe anterior. La única diferencia es que, en lugar de indicar al programa navegador el nombre y la localización de un documento de texto HTML para que lo cargue, se le indica el nombre y la localización de un fichero que contiene una imagen. La estructura de la etiqueta es:
Con el comando IMG SRC (image source, fuente de la imagen) se indica que se quiere cargar una imagen llamada imagen.gif (o el nombre que tenga).
Dentro de la etiqueta se pueden añadir otros comandos, tal como ALT
46
Con el comando ALT se introduce una descripción (una palabra o una frase breve) indicativa de la imagen. Este comando, que en principio se puede omitir, es en beneficio de los que accedan a nuestra página con un programa navegador en forma de texto sólo. Ya que no son capaces de ver la imagen, por lo menos pueden hacerse una idea sobre ella. Pero no es sólo por esto. Hay casos, como veremos más adelante, en los que se utiliza una imagen como enlace a otra página. Si se omitiera este comando, los que utilizan dichos navegadores no podrían de ninguna manera acceder a esas páginas.
Con respecto a la localización del fichero de esa imagen, se puede decir aquí lo mismo que en el epígrafe anterior referente a los enlaces.
Al igual que una página con la que queremos enlazar puede estar fuera de nuestro sistema, (en cuyo caso había que indicar su URL o dirección completa), podemos cargar una imagen que no esté en nuestro sistema siguiendo el mismo método, es decir, indicar en la etiqueta el URL completo de la imagen. Aunque esto no es muy aconsejable, pues alargaría innecesariamente el tiempo de carga de nuestra página.
Las imágenes deben estar guardadas en un formato de fichero especial llamado GIF. (Hay también otro formato más avanzado, del que se hablará más adelante). Este formato GIF almacena las imágenes con un máximo de 256 colores, en forma comprimida. Hay programas gráficos (como el Paint Shop Pro para el PC, o el Graphic Converter para el Mac) que nos permiten guardar las imágenes en este formato, además de cumplir otras muchas tareas de manipulación de las mismas.
Un aspecto muy importante a tener en cuenta es el tamaño de las imágenes, pues una imagen grande supone un fichero grande, y esto puede resultar en un tiempo excesivo de carga.
Para elegir la posición de la imagen con respecto al texto hay distintas posibilidades. La más sencilla es colocarla entre dos párrafos, con un titular a un lado. Los navegadores más actuales (como el Netscape Navigator y el Microsoft Internet Explorer) permiten que el texto pueda rodear a la imagen (como se verá más adelante, en el Epígrafe 8).
De momento nos vamos a limitar a escoger la posición del titular con respecto a la imagen (si es que queremos ponerle un titular, claro está). Se puede poner arriba, en medio o abajo del lado de la imagen. Para ello se añade el comando ALIGN a la etiqueta, de la siguiente manera:
Titular alineado arriba
Titular alineado en medio
Titular alineado abajo
Otra posibilidad muy interesante es la de utilizar una imagen como enlace a otra página. Para estos casos se utilizan generalmente imágenes pequeñas (iconos), aunque se puede usar cualquier tipo de imagen.
Según vimos en el epígrafe anterior, la estructura general de un enlace es:
47
En este caso sustituimos xxx por el nombre del fichero de la página a la que queremos acceder. Y en lugar de yyy ponemos la etiqueta completa de la imagen (que queda así englobada dentro de la etiqueta del enlace)
Como ejemplo vamos a utilizar la imagen (hand.gif) para acceder al ejemplo práctico del epígrafe 2 (mipag2.html):
Pulsando la imagen comprobamos cómo efectivamente enlaza con la página deseada. Obsérvese además que la imagen está rodeada de un rectágulo del color normal en los enlaces. Si no se desea que aparezca ese rectángulo, hay que incluir dentro de la etiqueta de la imagen el atributo BORDER=0, es decir:
Posicionando el cursor sobre esta última imagen, comprobamos que actúa también como enlace aunque carezca del rectángulo de color. Esto puede resultar más estético.
También podemos utilizar una imagen para enlazar con otra imagen. En este caso sustituimos xxx (el destino del enlace) con el nombre del fichero de la imagen a la que queremos acceder e yyy (lo que aparece en pantalla como el enlace) por la etiqueta completa de la imagen que queremos que aparezca en la pantalla como el enlace de la otra.
Por último, otra posibilidad es la de utilizar un texto para enlazar con una imagen. En este caso sustituimos xxx (el destino del enlace) con el nombre del fichero de la imagen a la que queremos acceder e yyy (lo que aparece en pantalla como el enlace) por el texto. 48
Supongamos que queremos enlazar con la imagen hand.gif por medio de un texto:
Que da como resultado:
Un tipo de imágenes del que se hace abundante uso y que sirven para mejorar la presentación de la página son los iconos, botones, barras separadoras, etc. A pesar de su tamaño o forma, son imágenes como cualquier otra.
Por ejemplo utilizamos un boton aceptar y escribimos en el sitio correspondiente:
Mis aficiones