Centros de Investigación, agencias de gobierno, universidades, medios de comunicación, bibliotecas, museos, casa editoriales y otras organizaciones, están impulsando estrategias que permitan mejorar el acceso a la información creada, almacenada y mantenida por ellos. Aunque este escenario mundial de publicación abierta de información es muy positivo, aún queda mucho trabajo en investigación e ingeniería por hacer. Las organizaciones que se identifican como Open porque publican contenido en páginas Web o PDFs deben considerar que el liberar documentos digitalizados solamente es el primer paso hacia una verdadera apertura. Una gran cantidad de información disponible en la Web no está en formato máquina (“machine-readable” format) sino en documentos no estructurados (tales como archivos .DOC, HTML, PDFs) que plantean grandes desafíos a la hora de procesar automáticamente su contenido.
Los datos en PDF son silos o “ghettos amurallados de datos” que disminuyen las posibilidades de intercambio, re-uso, integración e interoperabilidad de la información. Así, los datos que están contenidos dentro de un PDF o en páginas HTML son difíciles de procesar, poco prácticos a la hora de reusar y resultan poco sustentables y accesibles en un escenario global de descubrimiento y reuso de datos abiertos.
Las iniciativas de Open Data y Web Semántica pueden solucionar muchos de los problemas que representan los documentos digitalizados no estructurados cuando se quiere compartir y reusar información.
En este sitio web se presenta el resultado del estudio y aplicación de tecnología Linked Data para el acceso en línea a datos Universitarios Abiertos y Enlazados como una de las principales iniciativas de esta región.