Significado de Formato de Archivo

Entender el formato con el cual se trabaja ayuda a obtener los mejores resultados

¿Qué es el formato de archivo?

Diferenciado entre la clase ejecutable o no, es la lectura que corresponde a la decodificación de datos para traducirse por ejemplo en una imagen, audio, o texto. Este procesamiento hace posible que un programa entienda archivos con una terminación específica, denominado a nivel técnico como extensión, por ejemplo Word con respecto al .doc, Acrobat con respecto al .pdf, o el establecimiento de un estándar, por ejemplo en imagen sobre el .jpg o .gif.

Por su parte, los ejecutables están dados por la refrerencia .exe, a los cuales uno les proporciona privilegias de acceso al sistema. Un programa generalmente se encuentra en este formato para poder instalarse. También, es una vía de propagación típica de un virus, camuflándose como otra cosa, y es que uno no tiene manera de saber lo que está dentro de un .exe hasta que lo ejecuta; uno sabe apenas la fuente de origen, que puede ser confiable o producto de un engaño.

La historia de los formatos de archivo se remonta a las primeras computadoras que dispusieron de la capacidad de grabar archivos en un disco físico, aunque podemos remontarnos incluso más atrás, a las primeras cintas magnéticas si consideramos como formato el descriptor de archivo y las marcas grabadas en la cinta para marcar elementos como el inicio y el final del archivo, aunque no sería del todo correcto referirnos a ello de esta forma.

Identificación de los tipos de formatos

A grandes rasgos, tenemos dos tipos de archivos: ejecutables y no ejecutables o de datos. No obstante, algunos autores citan las librerías de código compartido (como las famosas DLL’s de Windows) como un tercer tipo de archivo entre los dos anteriores.

Los formatos de archivo de datos acostumbran a ser intercambiables entre plataformas, algo que no siempre ha sido tan fácil. Por ejemplo, en tiempos pretéritos, los formatos de texto plano de Windows, Unix y Mac OS no eran totalmente compatibles, y cuando cargábamos uno en un sistema distinto al que habíamos utilizado para crearlo, veíamos caracteres raros o las distintas líneas juntas, como si quien lo hubiera creado no hubiera pulsado la tecla intro en ningún momento.

Esto era debido a que Unix incluía un retorno de carro simple entre líneas, mientras que Microsoft utilizaba uno doble para Windows. Además, los juegos de caracteres eran distintos.

Estas diferencias se fueron limando a medida que los usuarios demandaban cada vez mayor interoperabilidad entre sistemas distintos.

Los distintos programas que requieren guardar información lo hacen de distintas formas. Así, un documento de texto formateado se puede guardar de tantas formas distintas como procesadores de texto existen, y tenemos un buen ejemplo de ello en los formatos DOC y RTF, que son distintos pese a que existen programas (Microsoft Word, OpenOffice/LibreOffice, WordPerfect,…) que pueden trabajar con ellos. Esto nos lleva a una nueva dicotomía: los formatos abiertos y los propietarios.

Por ejemplo, el antes mencionado formato DOC es propietario de Microsoft, mientras que el formato ODF (también para texto) es libre. La diferencia se encuentra en que las especificaciones del propietario solamente las tiene la empresa productora y las proporciona a quien ella quiere, mientras que las especificaciones del formato libre se encuentran disponibles en Internet para toda aquella persona que quiera implementarlas en su software.

Como hemos podido deducir, no solamente tenemos un formato de fichero para cada tipo de uso, y otro ejemplo de esta variedad lo encontramos en los formatos de vídeo: AVI, MPEG, MOV, MKV, DivX, FLV, WMV, RM,…

Lo que, en general, se intenta con cada nuevo formato de archivo, es que sea más eficiente que aquellos que lo han precedido, almacenando mayor cantidad de información en menos espacio.

Esto se consigue mediante la aplicación de algoritmos de compresión, especialmente si los contenidos son exclusivamente o contienen algo de vídeo, audio o fotografías.

Compatibilidad e interoperabilidad

Como he indicado antes, no siempre ha sido fácil utilizar archivos generados en una plataforma informática en otra distinta, un aspecto que hace años dejó de ser un problema. No obstante, en algunos casos (como el antes indicado de los ficheros de texto plano) podemos encontrarnos con que el software con el cual lo abrimos nos pregunta por un tipo de factor de conversión, como el juego de caracteres.

Indicar este de forma incorrecta puede llevar a que no podamos leer correctamente el contenido del archivo, algo que es posible solucionar de una forma tan simple como volver a abrir el archivo.

Hay archivos que pueden ser abiertos directamente por el sistema operativo (la mayoría de plataformas incorpora soporte nativo para archivos de texto plano TXT, y de texto formateado RTF), mientras que otros requieren de un programa determinado.

En este caso, deberemos disponer de la versión del programa para nuestro sistema, o bien de un programa que disponga de compatibilidad para poder gestionar el tipo de archivo determinado.

Un buen ejemplo de esto último son los archivos de Microsoft Office como los XLS o DOC (o sus versiones XML contemporáneas) en GNU/Linux; no existe una versión de la suite ofimática de la compañía fundada por Bill Gates para el sistema del pingüino, pero tenemos algunas suites como OpenOffice/LibreOffice o KOffice que disponen de filtros que las hacen capaces de trabajar con dichos formatos de archivo.

De igual forma, no podemos reproducir los archivos de vídeo MOV con QuickTime en Linux, ya que Apple no produce dicho software para el sistema del pingüino, pero disponemos de otros programas como VLC, un completo reproductor de vídeo que también nos permite reproducir otros formatos.

Incluso, desde LibreOffice, contamos con la posibilidad de abrir archivos de Dbase, un formato nacido originalmente para el entorno MS-DOS, pero que pueden interpretar varios programas fuera de dicho entorno y de Windows, considerando este último como el sucesor directo del MS-DOS.

Asignación de una extensión a un formato

Hay dos formas de vincular un archivo con un formato determinado, con el programa que debe manejarlo, siendo la más utilizada la de la extensión.

Ésta, que se diferencia del nombre porque va separada por un punto, es habitualmente de entre dos y cuatro caracteres, siendo lo más habitual de tres. Por ejemplo, para los archivos en formato Portable Document, es .pdf, mientras que para los nuevos archivos en formato XML de Word es .docx, para los archivos de imagen JPEG puede ser .jpg o .jpeg, para los ficheros de audio del formato desarrollado por Sun Microsystems, la extensión es .au, mientras que para los famosos MP3 es… efectivamente, algo tan lógico como .mp3.

La otra forma es mediante un descriptor implementado en forma de metadatos, un método utilizado históricamente por la plataforma software de Apple.

Finalmente, también se graba información dentro del mismo archivo, identificando el formato.