Mapas vectoriales en formato SVG – La Wikipedia

La Wikipedia es una fuente inagotables de recursos tanto gráficos como textuales y de información en general. En el caso de la cartografía podemos encontrar infinidad de mapas vectoriales que podemos descargar y editar a nuestro gusto incluso para fines comerciales (habitualmente la licencia nos lo permite).

En esta ocasión, los enlaces proporcionados son hacia cartografía vectorial en formato .svg (scalable vector graphics). Este formato de ficheros es perfectamente editable desde Illustrator (aunque existen aplicaciones como Inkscape o Sketsa más afines al .svg). En nuestro caso, la edición desde Adobe Illustrator nos permitirá generar ficheros aptos para imprenta.

mapaespana.jpg

Sin más, dejo este listado de enlaces que harán las delicias de más de uno:

Mapas de España en formato .svg de la Wikimedia

Mapas de Europa en formato .svg de la Wikimedia

Mapas de la Unión Europea de la Wikimedia (algunos no están en .svg).

Mapas del Mundo en formato .svg de la Wikimedia

Imprimir un PDF con capas desde Microstation V8

Una de las posibilidades que ofrece Microstation v8 es la de poder imprimir un fichero PDF directamente a través del controlador de impresora PDF que Bentley proporciona en la instalación de su software.

Pero aparte de la utilidad que supone que se pueda imprimir la cartografía directamente a PDF, existen una serie de opciones que permiten implementarla de una manera muy sencilla. Entre ellas se encuentra la posibilidad de crear un PDF con capas de nuestro archivo dgn original.

Como primer paso deberemos ir al Menú Archivo–>Imprimir, donde aparecerá una ventana en la cual pulsaremos en Controlador Bentley. Se desplegará un menú desde donde elegiremos pdf.plt. Una vez seleccionado el controlador, pulsaremos Aceptar.

controladorpdf.jpg

Acto seguido, y dentro aún de la ventana Imprimir, deberemos seleccionar Editar controlador de impresión desde el menú Archivo de esta ventana.

editarcontrolador.jpg

En este momento se abrirá el Bloc de Notas, desde donde podremos editar dicho controlador.

Por defecto, la impresión del PDF con capas viene desactivada. Para activarla, únicamente debemos quitar el punto y coma (comentario) que está delante de la línea que pone CmdName /appname=”pdf” /command=”BookMarks” /qualifier=”On” y ponérselo a la línea siguiente, donde pone CmdName /appname=”pdf” /command=”BookMarks” /qualifier=”Off”.

capasoff.jpg

De tal forma que el resultado final será como este:

capason.jpg

Debemos cerrar el Bloc de Notas y, en la misma ventana de Imprimir, seleccionamos Volver a cargar controlador de impresión.

volveracargar.jpg

Como de costumbre, seleccionaremos el tamaño de papel, la escala… ¡y a imprimir!

La edición de los controladores también se puede hacer directamente con el Bloc de Notas (sin tener abierto Microstation), localizando los ficheros correspondientes en C:\Archivos de Programa\Bentley\Workspace\System\plotdrv. Es buena idea hacer una copia del fichero original “por si las moscas”.

El resultado será un PDF que nos permitirá activar o desactivar la visualización de los niveles de Microstation (ahora capas) a nuestro antojo. Tanto es así que también incluye los niveles de los archivos de referencia que el .dgn original tenga vinculados.

Como muestra un botón

capaspdffinal.jpg

Otras cosillas a tener en cuenta:

De la misma manera que editamos el controlador para activar las capas del PDF, también podemos editar los tamaños que vienen predefinidos para este controlador. Simplemente pondremos los punto y coma en las medidas Inglesas y se los quitaremos a las medidas Métricas.

nuevostamanos.jpg

Pero aún hay más… Si además queremos que los “pesos” (grosores) sean simbolizados de forma “particular”, también es posible editándolos en el lugar correspondiente.

pesos.jpg

La utilidad es muy grande para todos aquéllos que se dedican a la cartografía y usan Microstation v8 para este fin.

OCR con adobe Acrobat Professional

La verdad es que es una función de Acrobat que está poco valorada, pero que realmente nos puede “salvar el pellejo” (y las huellas dactilares) en algunos momentos.

¿Cuantas veces has necesitado recuperar los textos de una imagen JPG o TIFF para no tener que volver a escribirlos a mano y resulta que no tenías un software OCR para poder hacerlo? Seguro, pero que muy seguro que dispones de Acrobat Proffessional desde hace bastante tiempo y no has caído en la cuenta de utilizarlo.

En el mercado existen otras aplicaciones muchísimo más especializadas para la recuperación de textos a través de imágenes, pero no se suelen comprar sólo para un par de ocasiones puntuales. Por lo tanto el uso de esta técnica resultará de utilidad cuando se plantee el hecho de que no queremos “picar” texto y la cantidad de este no es desmesurada. Acrobat permite la importación de archivos ráster en formato TIFF, JPG, GIF, BMP…, el problema que puedes tener a la hora de hacer el OCR es la resolución de los archivos de entrada. Si la has cuidado, o te proporcionan buenos originales el resultado será bastante satisfactorio.

Al tema…

Si has leído con atención la entrada anterior, lo que hicimos fue generar archivos TIFF en modo Mapa de Bits. Ahora toca utilizarlos como originales. Por lo tanto vamos a ajustar la aplicación para que reconozca perfectamente nuestros ficheros y podamos unir varios en un sólo documento para efectuar el OCR de todas las páginas a la vez.

Deberás acceder al Menú Archivo–>Crear PDF–>De varios archivos.

crearpdfdevarios.jpg

Indica a Acrobat dónde se encuentra(n) el(los) fichero(s) que vas a convertir en PDF… ¡Ah! por si no lo sabías, puedes seleccionar varios archivos a la vez. Pulsa Agregar.

seleccionmultiple.jpg

Si es menester ordénalos para que formen las páginas del PDF consecutivamente o en el orden que desees.

ficheros-desordenados.jpg

ficheros-ordenados.jpg

Una vez hecho esto, pulsa Aceptar. Acrobat creará un PDF multipágina (en caso de que sean varios los ficheros originales).

Si sólo es uno como en el ejemplo de la entrada anterior te encontrarás con una sola página.

textoocrtif.jpg

Cuando tengas tu documento PDF en la pantalla, ve al Menú Documento–>Reconocer texto usando OCR–>Inicio. Aparecerá una pantalla donde podrás indicar el rango de páginas que quieres reconocer y, además, existe un botón que te permite editar diversas opciones. Entre ellaspodrás seleccionar el lenguaje que quieres utilizar. En el caso del ejemplo cambiaremos la selección a Inglés Americano (puesto que nuestro original es de Estados Unidos).

reconocer-texto.jpg

editar-opciones.jpg

Pulsa Aceptar en las dos ventanas y Acrobat comenzará a efectuar el Reconocimiento Óptico de Caracteres.

Cuando haya terminado no verás nada anormal en el PDF…

Ve al Menú Archivo–>Guardar Como y guarda tu documento como Documento de Microsoft Word o como Formato RTF.

Donde hayas dispuesto que Acrobat guarde el archivo, encontrarás un bonito documento de Word o de Texto RTF que podrás importar a Indesign, o a Quark para poder maquetarlo.

Aquí tienes la comparación entre el fichero TIFF original y el documento Word final.

news_text6.jpg texto-ocr-final.jpg

Si te fijas con atención, Acrobat ha intentado mantener la geometría de la página original en la medida de lo posible, aunque realmente el resultado difiere bastante del original. Por lo menos hemos conseguido conservar las negritas.

Tengo que decir que el fichero de texto final siempre queda “bastante guarro” (a nivel de tipografías, retornos de carro, formatos de párrafo, etc.) y hay que limpiarlo. Pero eso queda para otro día…

¡Por cierto! ¿A que ya sabes como hacer búsquedas en un documento PDF?

El OCR en Acrobat permite además que el documento PDF final tenga la característica de que puedes hacer búsquedas en él. Aunque no hayas guardado el texto en formato Word o RTF (eso se queda para los que vamos a reutilizarlo) puedes realizar búsquedas a lo largo de todo el documento.

Esta técnica es válida para Acrobat desde versiones relativamente antiguas. Cambian los menús, pero el producto final se consigue de similar forma.

Verás cuanto tiempo ahorras…

OCR – Técnica General de preparación con Photoshop

Uno de los mayores inventos de la humanidad (en cuanto a nuestra labor se refiere) ha sido el ordenador. Con él podemos dibujar, retocar, escanear, maquetar… Pero dentro de este “gran invento” el que los ordenadores consiguieran detectar letras dentro de imágenes escaneadas ha sido de gran ayuda para todos aquellos que nos dedicamos a la preimpresión. La tecnología OCR (Reconocimiento Óptico de Caracteres) nos permite obtener textos editables de lo que en principio no son más que imágenes escaneadas de un libro, una revista, un folleto…

Los programas OCR dedicados permiten hacer un previo del escaneado desde donde podremos elegir las zonas a escanear, también permiten el escaneo con ajustes de tonos, además de una corrección previa del texto antes de la salida final y nos dan a elegir el formato final del fichero de texto.

No me voy a centrar en ningún software en especial sencillamente porque la técnica que describiré es el método más general de preparar los ficheros para efectuar el Reconocimiento Óptico de Caracteres. Para el ejemplo me he bajado una imagen de internet que cumple “ciertas características”.

news_text.jpg

Lo primero que debes conseguir para hacer un buen OCR es que el original sea lo más limpio y definido posible. Si depende de tí mismo el escaneo de los originales, lo suyo es que desde el principio empieces a hacer las cosas de la mejor manera.

1.- Para empezar (y si no son muchos), te aconsejaría que escanearas tus originales a 600 pppp, en escala de grises y todos de una vez. Si son muchos los originales y no te quieres entretener en exceso (o lo haces automáticamente), procura que la resolución del escaneo sea la mejor posible. El sugerir hacerlo en escala de grises tiene su explicación: es la mejor manera de que puedas captar los matices que pueden hacer que tu aplicación OCR interprete mejor o peor el texto final.

2.- Elimina del escaneado las imágenes, filetes y cosas que no quieras que aparezcan posteriormente (o que pienses que te puedan acarrear problemas). En este momento nos estamos centrando en el texto, y, de momento, no necesitamos nada más.

news_text2.jpg

3.- Una vez que tengas escaneados los originales y eliminados los elementos indeseados , procede a corregir los niveles (o las curvas, lo que prefieras) de cada una de las imágenes. Personalmente, yo lo hago buscando con el cuentagotas las zonas que quiero blancas del todo, así como las que quiero negras completamente. En el caso de que sean muchos los originales escaneados, puedes aplicar una acción de Photoshop para que te modifique las curvas o los niveles de todas las imágenes de una vez (pero supongo que sabes que esto las modificará de un modo más genérico).

news_text2curvas.jpg

4.- Con seguridad, te habrán quedado suciedades alrededor de los textos. Elimínalas en la medida que puedas y que consideres que no te entretiene mucho. Yo utilizo el marco rectangular para para borrarlas en los exteriores de los textos (los márgenes). De esta forma “te llevas” muchas imperfecciones de una vez. Entre las líneas y las letras encontrarás también suciedades. Procura eliminar las que puedas o, en su caso, las más evidentes que pudieran hacer “confundirse” al software de OCR. Puedes aplicar un desenfoque gaussiano muy pequeño para que esos puntitos negros se transformen en puntitos grises. Utiliza otra vez la técnica de niveles o curvas para dejar la mayoría en blanco. Hazlo de tal forma que las letras no se vean afectadas (o por lo menos intenta que sea lo mínimo).

news_text3limpio.jpg

Te habrás dado cuenta de que estos procesos han engordado un poquito la letra. Lo que no debes permitir es que se cieguen los caracteres.
6.- Cuando el texto esté limpio, ponlo recto para que el software haga su trabajo posteriormente de una forma más sencilla. Puedes ayudarte de las guías de Photoshop o utilizar la técnica para girar imágenes que describí en una entrada anterior:

Enderezar imágenes en Photoshop

Entre otras cosas, el hecho de que la imagen esté escaneada en Escala de Grises permite esto. Si fuera un bitmap en B/N no podrías hacerlo.

news_text4-recto.jpg

7.- Si ya has limpiado la imagen y has puesto recto el texto, puedes continuar tu trabajo en función de como esté dispuesto el texto escaneado:

Si el texto está en dos o más columnas: Puedes modificar la disposición de éstas para que el texto a “reconocer” vaya de forma contínua. Habitualmente los programas de OCR “dedicados” te permiten escanear zonas que tú luego numeras para que el software las reconozca en el orden que tú les has proporcionado. Como este no es nuestro caso, lo que hacemos es un fichero con el texto contínuo y así evitamos problemas de bloques de texto reconocidos en orden incorrecto. Una vez hayas colocado el texto en un solo bloque puedes acoplar la imagen (puesto que seguro que has creado alguna capa). Si quieres también puedes unir varios documentos en uno para posteriormente procesar de un tirón varias páginas de texto.

news_text6.jpg

Si el texto está en una sola columna: no tendrías que hacer nada más. Esta es la disposición ideal.

8.- Llega el momento final. Habitualmente los programas de OCR suelen utilizar imágenes TIFF en Modo Mapa de Bits. Por lo tanto, y si es tu caso deberás cambiar el Modo de color de la imagen en Escala de Grises a Mapa de Bits. Si tu aplicación de OCR lo admite podrías saltarte este paso.

modo-mapa-de-bits.jpg

Al cambiar el Modo de Color, aparecerá una nueva ventana que te solicitará cómo quieres hacer la conversión. Deberás tener cuidado de que la resolución de salida sea la misma que la de entrada (que es la correspondiente a la resolución con que has escaneado tu documento). el Método de Conversión deberás usar Umbral al 50%. Este método pasará todas las partes de la imagen que vayan del 50% al 100% a negro puro y todas las que vayan del 50% a 0% a blanco puro.

modo-mapa-de-bits2.jpg

¡¡Ya está!!

Puedes guardar tu ficheros como TIFF y ejecutar tu programa de OCR poniendo como originales los ficheros recién creados.

Reitero que esta técnica de preparación es general y no tiene que ser tomada como algo a seguir estrictamente. Todo depende de con qué programas contemos, el tiempo de que dispongamos, la calidad de los originales…

Xtension para Arrastrar y Soltar en Quark de Mac (2) y otras cosillas…

En una entrada anterior ya hablé de una Xtension que permitía hacer esto en Quark para Mac.

Xtension para Arrastrar y Soltar en Quark de Mac

Como otra opción, en la página web de QuarkLabs, encontrarás una serie de Xtensions y utilidades que implementan la productividad en QuarkXpress.

Entre ellas está DragDropImage.xnt, que te permite que arrastres desde el Finder del Mac las imágenes al documento Quark que estás maquetando. De esta forma evitarás el ir Importando Imágenes a través de los menús (esto a veces puede ser muy farragoso).

Pero aparte de esta Xtension, existen otras utilidades como:

Shadow Caster 3.3: Xtension que te permite crear sombras y efectos especiales a las imágenes (no cumple la misma función que el menú Efectos de Imagen)

Quark Welcome Screen: Xtension que cambiará la cara a la pantalla de presentación de Quark y que te permitirá acceder a los últimos proyectos en los que hayas trabajado.

Quick Look filter: permite que previsualices tus documentos de QuarkXpress en Mac OSX 10.5 (Leopard) a través de Quick Look.

Spotlight Filter 2.0 for Mac OS 10.5: permite que hagas búsquedas con Spotlight en los documentos de QuarkXpres. Dichas búsquedas las podrás efectuar dentro del texto de los documentos, por anchura o altura de página, por Hojas de Estilo…

Para poder descargarte estas Utilidades y Xtensions deberás registrarte.

Página 3 de 3123