Author Archives: Emilio Lorenzo

Estrenamos blog, Hablando de OJS

Fruto de nuestra actividad profesional y experiencia, lanzamos un nuevo espacio de reflexión y divulgación de información sobre OJS homólogo a nuestro blog sobre temas de DSpace, denominado Hablando de OJS

Nuestro principal objetivo es aportar información de valor a todas aquellas personas interesadas en el mundo de las publicaciones electrónicas y, especialmente, a los usuarios del sistema OJS de PKP.

Confiamos en que los temas a tratar os resulten interesantes y pedimos, de manera anticipada, vuestra participación a través del blog para enriquecer nuestro espacio de divulgación de información y conocimientos OJS.

Podréis acceder al contenido del mismo en esta dirección   http://www.arvo.es/ojs

Nuevos ficheros de idiomas de catalán y valenciano

A partir del trabajo efectuado en un par de proyectos Dspace, se han generado y puesto a disposición del resto de proyectos DSpace los siguientes ficheros de mensajes

DSpace Version 6, XMLUI, Catalán:  Traducción a la versión 6 realizada por EINA, Centre Universitari de Disseny i Art de Barcelona, a partir del fichero messages_ca.xml de la version 5, cuya traducción proviene de la Universitat de Vic  y puesto a disposición de otros proyectos por cortesía de su Biblioteca Universitaria.  Se puede descargar en el siguiente enlace

https://github.com/arvoConsultores/DSpace/blob/dspace-6_x/dspace-xmlui/src/main/webapp/i18n/messages_ca.xml

DSpace Version 5, XMLUI, Valenciano: A partir de una traducción pre-existente  de la Universitat de Valencia para la versión 4, se ha  traducido para la versión 5 por el Instituto Valenciano de Investigaciones Agrarias.  Se puede descargar en el siguiente enlace

https://github.com/arvoConsultores/DSpace/blob/dspace-5_x/dspace-xmlui/src/main/webapp/i18n/messages_ca.xml

 

 

 

 

Jornadas Ecosistemas del Conocimiento Abierto, ECA2017

Se celebraron del 25 al 27 de octubre de 2017 en Salamanca, las jornadas Ecosistemas del Conocimiento Abierto ECA2017,  que  incluyeron el 16º Workshop de REBIUN de Proyectos Digitales, las 7as Jornadas OS-Repositorios, y el 11º Coloquio Internacional de Ciencias de la Documentación.

Nuestra valoración es positiva, ya que no abundan los puntos de encuentro para especialistas en acceso abierto, experiencias desarrolladas en repositorios y resto de tendencias innovadoras en el conocimiento abierto. ECA2017 ha demostrado la pujanza de nuestro sector y actividad.

La organización tuvo la gentileza de invitarnos a presentar nuestra ideas en la mesa de debate ‘Los Repositorios del futuro’ junto con  Francisco García Peñalvo (USAL), Ignasi Labastida (CRAI, UB),Catalina Guzmán (UCO) y Belén Fernández del Pino (UC3M, Madroño, COAR) en una mesa moderada por Leticia Barrionuevo (ULE). Como el lema del congreso era “Ecosistemas…” pues nos lanzamos a hablar del papel futuro de los repositorios en el ecosistema, y he de reconocer, que salió algo extraña la charla.

Acá va el texto leído en la mesa:

“En primer lugar, gracias por invitarme a esta mesa de debate y gracias a los asistentes …..

Hablemos de ecosistemas. Estamos mas o menos de acuerdo que el lugar de la especie RI en el ecosistema es capturar preservar y difundir el conocimiento, …..empecemos pues la predicción…

Por una parte, se requerirá cambiar los modos que usan los repositorios para capturar y tener contenidos completos, reflejando la totalidad de la producción científica-investigadora de las instituciones. Hablando en términos de ecosistemas, pienso que las relaciones de simbiosis serán  evidentes, asumiendo los repositorios papeles de simbiosis parasitaria- entendamos el término parásito en su acepción biológica y no en su acepción peyorativa- Y siguiendo con la analogía, veremos a los repositorios actuando como huéspedes y/o hospedadores en una suerte de mutualismo parasitario con otros sistemas…..

Observaremos incluso relaciones de hiperparasitismo (parásitos que parasitan a otros parásitos) entre los integrantes del ecosistema. Ayer, la Politécnica de Barcelona nos presentaba un modelo de hiperparasitismo mutuo, la simbiosis máxima, en que OpenAire les parasitaba, recolectando su contenido y ellos parasitaban a OpenAire, enriqueciendo el contenido de UPCommons con la información de este otro sistema.

Siguiendo con las tendencias que pensamos que se afianzarán en el futuro cercano, veremos repositorios siendo alimentados automágicamente (o casi) por otras especies ya existentes en el ecosistema  (crossref, pubmed, orcid, elsevier,  openAire….)

Y por otra parte asistiremos a la aparición de repositorios con variaciones genéticas en el sistema de auto-depósito, que tornará a ser un sistema ligero y posiblemente dotado de “inteligencia”, con el fin de que el depósito no se convierta en una traba adicional para los investigadores, básicamente intentando que el investigador no se percate que le parasitamos….

Claramente visionamos a los repositorios del futuro ocupando nichos ecológicos de otras especies … y viceversa…en una suerte de ocupación de hábitats ajenos.. Pensamos que vamos a asistir en un cambio de la especie “repositorio” que evolucionará desde su foco adaptado a la producción científica, centrados en el objeto o en la colección, y que se reorientarán, este cambio se denomina plasticidad fenotípica, hacia una centralidad en el autor. Los autores tienen que adquirir una importancia que hasta ahora no parecen tener en los repositorios,… y esto pasa por: “Cuidar al autor” por ejemplo con los sistemas de depósito simplificados que comentábamos antes y “Mimar al autor” ofreciéndoles servicios de información (estadísticas de autor, altmetrías, servicios de suscripción inteligentes o avanzados, etc..)

Incorporarán igualmente capacidades de descripción y gestión de entidades adicionales (autor, departamento, institución, etc), unas veces en competencia, es decir siendo depredadores, por el espacio natural de los sistemas CRIS de carácter más básico y otras veces en simbiosis con los CRIS más avanzados. Esperemos no ver a los repositorios como presas en el ecosistema, pero esta conjetura no la puedo avalar.

Y por último, finalizar con una consideración sobre los objetos digitales almacenados…algunos repositorios mutarán para poder gestionar o manejar objetos de investigación complejos, multipartes, con contexto, etc….. a la par que cambiará el fenotipo de los repositorios para incluir extensiones de los contenidos como anotaciones, comentarios, peer review, etc

Bien,… la bola de cristal ya no da mas de sí,… muchas gracias por su atención.

Versiones en DSpace

Nos preguntan en ocasiones qué significan los números de las versiones de Dspace. Vamos a intentar explicarlo:

Antes de 2012, las versiones se numeraban como 1.x, 1.6, 1.7 y 1.8.. Cada año aproximadamente se lograba terminar una versión nueva y se liberaba.  En ese momento, 2008 -2010,  se tenía en mente la version “definitiva”, DSpace 2. Todavía hay documentos indexados por google que hablan de esa versión.

Pero esa versión 2 nunca llegó, así que en 2013 se decidió comenzar un nuevo esquema de numeración de versiones en forma [major].[minor].  Dspace desde entonces se numera como 3.0 (la primera tras el cambio de criterio) 3.1, 3.2…. 4.0,  4.1. Nunca hubo una versión 2 de Dspace.

¿Y cómo se decide el [major].[minor]…?

Incrementar el primer número, [major], significa que estamos ante una versión principal de Dspace. Esta incluye: nuevas funcionalidades, cambio de arquitectura, mejoras del sistema y corrección de errores.  Así, las versiones 3.0, 4.0, 5.0, 6.0 y la próxima 7.0, suponen una evolución sustancial del software.  Evolucionar entre versiones, cambiando el primer número, supone por lo general un esfuerzo considerable para:

  • La comunidad de desarrolladores de Dspace, que intenta mantener un calendario de una [major] por año, aunque no siempre se consigue.
  • Los repositorios DSpace, las instalaciones propiamente dichas, que deben ejecutar procedimientos de migración de datos y código entre versiones, prueba de la nueva versión, formación en las nuevas funcionalidades, etc. Es decir, proyectos por lo general, complejos.

Dspace releases

Las versiones menores [minor] son las que incrementan el segundo número. Sólo incluyen parches y resolución de bugs (bugs fixes) de la versión principal. Así tenemos p.ej. 5.1, 5.2, 5.3, 5.4, 5.5 y 5.6 por ahora.  Moverse entre versiones menores es un proceso por lo general simple. Basta con (haciendo un backup) actualizar nuestra version en los directorios fuente, y desplegar. Por lo general es un proceso simple…(¡¡o al menos mucho mas simple que un cambio de versión mayor¡¡)

El compromiso de la comunidad Dpsace es proporcionar parches de seguridad a las tres últimas versiones mayores de Dspace.  Es decir si , ahora al escribir esto, mayo de 2017, hay una vulnerabilidad  detectada y se corrige con un parche, se emitiría una actualización, denominándose 4.8 , 5.7 y 6.1 que son los siguientes numeros [minor] que hay disponibles…… Sin embargo, la comunidad de desarrollo DSpace solo nos comprometemos a parches funcionales para la versión última (aunque a veces se aprovecha para meter algún parche a versiones mayores anteriores….)

El soporte de ORCID en Dspace 5 (y superiores)

En el anuncio a finales de 2014 de la  versión 5, figuraba entre las funcionalidades destacadas el denominado “soporte ORCID”  (para interfaces XMLUI con mirage ó mirage 2), contribución de @tmire y de la Universidad de Missouri. Esta funcionalidad se definía como:

The current product will provide a means for realtime ORCID lookup during submission of an item. A subset of ORCID metadata will be retained in a local store.

Ampliando la escueta definición anterior, diríamos que DSpace  incorpora  la capacidad de enlazar un campo de metadatación, como  dc.contributor.*,  con una consulta (lookup)  sobre la base de datos de autores orcid.org.

clipboard01La implementación estándar de ese lookup, es decir lo incluido en Dspace v5,  normaliza el nombre del autor al valor del nombre de autor orcid, le asigna una clave interna de autoridad (un id de authority control que no tiene nada que ver con el orcid-id) y crea una entrada adicional en el nuevo núcleo SOLR  de caché de autoridades, ésta si, conteniendo el orcid_id.  Por ejemplo, la entrada del autor que se seleccionó en la pantalla anterior quedaría (en formato JSON) así:

{
"id": "53577e21-cd61-4e84-ae73-400c73a60d31",
"field": "dc_contributor_author",
"value": "Lorenzo, Antonio",
"deleted": false,
"creation_date": "2016-08-17T15:02:25.323Z",
"last_modified_date": "2016-08-17T15:02:25.323Z",
"authority_type":"orcid",
"first_name": "Antonio", "last_name": "Lorenzo",
"orcid_id": "0000-0002-5831-0808",
 }

Es decir, conseguirá en un primer paso normalizar nombres (bueno, quizá es bastante), pero el orcid-id  lo tiene por ahí oculto, dentro del SOLR  y poco mas podrá aprovechar de forma fácil ese proceso de consulta-desambigüación-normalización, teniendo que recurrir a extensiones sustanciales a Dspace si se quieren incluir integraciones adicionales usando la API de orcid, como sincronización de publicaciones, uso de la autenticación, etc…

La funcionalidad base es migrable hacia atrás para versiones 4, quizá para versiones 3, y para versiones JSPUI con algún trabajo y existe una implantación adicional para aquellos valientes que se atrevieron con el módulo  Dspace-CRIS.

Señalar que además hay funciones adicionales relacionadas con la importación-exportación batch de metadatos (BME)  y  que esta funcionalidad no cambia en la versión 6 (liberada hace nada) y no está prevista su ampliación para la versión 7 (¿enero 2018?)

DSpace versión 6

Bien, la versión 6 ya está aquí, se anunció su disponibilidad el 24 de octubre y ya está lista para ser instalada…

¿y qué nos trae de nuevo la versión 6? Pues unas cuantas funcionalidades y cambios:

  • Incorporación de Hibernate, herramienta de mapeo objeto-relacional, paso necesario para poder abordad la refactorización de la API de Dspace (estamos pensando en la versión 7). Si teníais código propio que accedía a la base de datos de Dspace, posiblemente tengas que reescribirlo…
  • Se mejora el sistema de configuración de Dspace, que ahora usa la sintaxis de Apache Commons Configurations. Las configuraciones de dspace.cfg pueden recargarse sin rearrancar el Tomcat, el fichero de configuración build.properties se ha cambiado por un local.cfg  y algunas mejoras más. Algunas mejoras, pero al ser un nuevo sistema pues hay que volver a aprender la forma de hacer despliegues…
  • Se ha retirado el soporte al sistema de acceso al almacenamiento (assetstore) basado en SRB (no habia constancia de que lo usasen muchas instalaciones). Para compensar, se ha añadido soporte al sistema Amazon S3.
  • Ya no se distribuye la interfaz LNI (poco o nulo uso).  Quedará no obstante como “add-on”
  • El motor de búsqueda basado en Lucene y los métodos de browse basados en base de datos desaparecen por completo del código (deprecated, en terminología de desarrollo de software). Ya se desaconsejaba su uso en la v4, si querías usarlo daba muchísimos problemas en la V5 y se ha finalizado eliminando estos elementos de código.
  • Tenemos unos nuevos informes, denominados Healthcheck (chequeo de salud) que revisan una serie de parámetros del repositorio y pueden enviar esos informes al administrador, por correo electrónico. Nos parece un avance sobre las posibilidades de comprobación existentes en versiones anteriores.
  • Es posible exportar los resultados de una búsqueda a CSV  (en XMLUI)
  • Hay un panel de control administrativo ampliado y configurable, las opciones del control panel, crecen y crecen….
  • Se anuncia el framework de importación de metadatos (aclaremos que realmente estaba  ya funcionando e incluso documentado extensamente en la versión 5) pero parece que hacen ahora el anuncio oficial. Será porque se aprovecha este framework para posibilitar la importación de metadataciones desde Pubmed, CrossRef, ScienceDirect, que insistimos, ya se podía hacer en la versión anterior….
  • La interface REST admite los mismos métodos de autenticación que las UI (hasta ahora solo se soportaba el login-password). Parece lógico, ¿verdad? sobre todo desde que se plantea para la próxima versión desagregar DSpace de las interfaces de usuario…
  • Aparece un sistema de chequeo de metadatos (REST metadata quality control) que permite interrogar via la interface REST sobre los valores de metadatos que tenemos en nuestros ítems..¡¡¡ muy curioso el funcionamiento !!! recomendable….
  • El operador de búsqueda de Discovery pasa a ser AND (el OR causaba más preguntas de la cuenta, pero realmente el cambio es mínimo, unas lineas en un fichero de configuración)
  • Se posibilita el indexado de documentos que se escriben de derecha a izquierda (RTL), como el árabe o el hebreo.
  • Se actualiza a PDfbox 2.0 y se incluye un nuevo generador de miniaturas de PDF (por lo que ya no es necesario el xpdf)

y seguro que me dejo algo….

Novedades Dspace en la conferencia Open Repositories 2016

La Conferencia Internacional de Repositorios Abiertos (11th International Conference on Open Repositories) se acaba de celebrar la semana pasada en Dublín. Al ser uno de los eventos principales en el mundo de los repositorios, pues no nos lo pudimos perder, pues concentra un gran número de novedades, presentaciones, proyectos, comunicaciones y  asistentes, de evidente interés.

Además, la Conferencia se aprovecha para la sesión plenaria de DuraSpace, en que la dirección rinde cuentas a los miembros de la organización, ver las diapositivas de la presentación y se anunció la nueva política de transparencia y apertura, openness, de DuraSpace.

Adicionalmente se celebraron los DSpace Interest Groups,  en que se actualiza el estado del proyecto. Tim Donohue, responsable técnico del proyecto DSpace, junto con un grupo de desarrolladores proporcionó una visión de la versión 6, del proyecto DSpace-CRIS y de la nueva interface de Dspace basada en Angular2.js. Ampliaremos estos temas en otro post.

Y no acabó ahí la conferencia, pues el jueves el DSpace Steering Group hizo una presentación sobre el Estado de Dspace, hablando sobre el modelo de gobernanza, la financiación, la membresía, el papel de los diversos grupos en el ecosistema DSpace  (DCAT, Registered Service Providers, Marketing Interest Group…) y la planificación o roadmap.

En cuanto a nosotros, pues la conferencia era un lugar ideal para presentar a una audiencia especializada el módulo OPRM que os hablamos en otro post. Y alli hablamos,  junto con Pandelis Perakakis, responsable del proyecto Open Peer Review, e Isabel Bernal, de digital.CSIC. Os mantendremos informados de novedades en este módulo.
IMAG1154

Módulo Open Peer Review

Con el apoyo financiero de OpenAIRE, la organización Open Scholar ha coordinado un consorcio de 5 socios para desarrollar un módulo de Peer Review Abierto para revisar y evaluar trabajos albergados en repositorios institucionales basados en software DSpace

Open Peer review module
En este proyecto han participado:

  • DIGITAL.CSIC, el repositorio institucional del Consejo Superior de Investigaciones Científicas
  • e-IEO, repositorio del Instituto Español de Oceanografía
  • IIIA-CSIC, Instituto de Inteligencia Artificial del CSIC en Cataluña
  • SECABA, Multidisciplinary Laboratory of Library and Computer Sciences en Granada
  • Arvo Consultores

El proyecto ha sido financiado por OpenAIRE 2020, EU-Horizon2020 Grant ID 643410, y se acaba de presentar en el Jardín Botánico de Madrid, ante un numeroso grupo de responsables de repositorios institucionales e investigadores interesados en los nuevos paradigmas de revisión científica.

Señalar que iguamente se presentará en la conferencia Open Repositories 2016 de este año en Dublín.

El módulo Open Peer Review, OPRM, se puede instalar en repositorios institucionales Dspace existentes como un add-on. Los objetos digitales alojados de estos repositorios podrían entonces ser evaluados por un número ilimitado de evaludores, permitiéndo no sólo una evaluación cualitativa en forma de texto, sino también las medidas cuantitativas que serán utilizados para construir la reputación del objeto. Es importante destacar que este sistema de evaluación es abierto y transparente. Por abierto -open- queremos decir que el texto completo de las revisione está a disposición de los usuarios junto con el trabajo de investigación original. Por transparente se entiende que la identidad de los revisores se divulgará a los autores y al público. En nuestro modelo, la apertura y la transparencia son dos aspectos elementales que consideramos necesariao para abordar el problema de opiniones sesgadas o no expertas, que es inherente al modelo de revisión por pares anónimos, que se caracteriza por la falta de responsabilidad de los colaboradores.

El código del proyecto, así como sus indicaciones para la instalación,  puede encontrarse en https://github.com/arvoConsultores/Open-Peer-Review-Module/wiki

 

¿Por qué debiera interesarte la versión 6 de Dspace?

Hemos de decir que DSpace 6 es, principalmente, una versión de transición hacia la versión 7, esa esperada versión en la que sólo habrá una única interfaz de usuario. Por eso, para poder abordar una transición manejable a la V7, se ha tenido que re-escribir la mayor parte de la Java API de DSpace. Igualmente se ha mejorado el sistema de configuración, para evolucionar hacia un sistema más flexible y con capacidad de carga dinámica de las configuraciones.

Para dar una idea del esfuerzo tras este cambio, unas cifras del mismo:

      La refactorizacion de la Java API ha requerido cambiar 1,440 de los ficheros java de la apliciación DSpace.
      El Sistema Mejorado de Configuración (Enhanced Configuration System) modifica menos ficheros ¡solo 324¡¡¡ pero afecta a unas 6,000 líneas de código con el fin de lograr un sistema más flexible de configuración de Dspace.

Si a lo anterior el añadimos unos procesos de prueba de Dspace (los testhaton son una parte de este proceso…) mas intensos, pues tenemos unas cuantas buenas razones para el retraso que esta versión está sufriendo (de finales de 2015 a enero de 2016, luego al 8 de febrero y luego a una fecha indeterminada entre marzo y abril o mayo, quién sabe…)

Bien, y funcionalmente ¿qué ofrece la nueva versión?

  • Mejoras a los plugins de almacenamiento físico, incluyendo soporte para el almacenamiento Amazon S3
  • Chequeo del estado del repositorio, con informes al administrador via correo electrónico.
  • Panel de control administrativo ampliado
  • mejoras a la REST API con soporte a todos los métodos de autenticación,  Shibboleth, LDAP, etc
  • mejoras a XMLUI : importación de metadatos de fuentes externas como Pubmed y  ScienceDirect).
  • mejoras a XMLUI:  exportación de resultados de búsqueda a CSV

Posiblemente no encuentres muchas razones (funcionales) para  plantear una migración, excepto que tu versión actual sea realmente antigua y quieras recoger los frutos funcionalmente jugosos de las versiones 3, 4 y 5.

 

 

XXIII Asamblea Anual de Rebiun

Arvo participa como patrocinador en la XXIII Asamblea Anual de la Red de Bibliotecas Universitarias Españolas en la Universidad de Cantabria los días 5 y 6 de noviembre del 2014. La Asamblea Anual es el  foro nacional para planificar la organización, el funcionamiento y los objetivos de REBIUN

La Red de Bibliotecas Universitarias, está formada por las bibliotecas de las 76 universidades miembros de la Conferencia de Rectores de las Universidades Españolas (50 de ámbito universitario público y 26 de ámbito universitario privado) y el CSIC.  Sus objetivos son liderar, coordinar y dar las directrices a las bibliotecas universitarias para poder realizar proyectos conjuntos que den como respuesta nuevos retos en ámbito del aprendizaje, la docencia, la investigación y la formación.

Información detallada del evento en el siguiente enlacehttp://eventos.crue.org/event_detail/2133/detail/rebiun-2015.-xxiii-asamblea-anual-de-la-red-de-bibliotecas-universitarias.html

y puedes seguir el evento por Twitter con el hashtag 

y además en Youtube,  la conferencia inaugural  por  Ignasi Labastida, con el título “Los retos de la investigación en abierto para las universidades” en  esta dirección:  https://www.youtube.com/watch?v=sP7lB9R37Co