{"id":1777,"date":"2018-05-17T09:22:03","date_gmt":"2018-05-17T08:22:03","guid":{"rendered":"http:\/\/www.arvo.es\/dspace\/?p=1777"},"modified":"2018-08-04T18:29:26","modified_gmt":"2018-08-04T17:29:26","slug":"preservacion-e-integridad-de-ficheros-en-dspace","status":"publish","type":"post","link":"https:\/\/www.arvo.es\/dspace\/preservacion-e-integridad-de-ficheros-en-dspace\/","title":{"rendered":"Preservaci\u00f3n e integridad de ficheros en DSpace"},"content":{"rendered":"<p>La preservaci\u00f3n y la integridad de los ficheros almacenados en un sistema Dspace preocupan con frecuencia, y con raz\u00f3n, a los gestores de los repositorios. Intentaremos despejar las dudas m\u00e1s frecuentes sobre el comportamiento del software DSpace al respecto.<\/p>\n<p>Una funci\u00f3n <em>hash<\/em> es, b\u00e1sicamente, un algoritmo criptogr\u00e1fico que aplicado a un fichero produce como resultado una cadena alfanum\u00e9rica \u00fanica, permitiendo determinar, por comparaci\u00f3n con valores anteriores de la cadena,\u00a0 los cambios en el mismo, la integridad del fichero. DSpace realiza el\u00a0 c\u00e1lculo del valor hash de cada fichero almacenado en el sistema, incluidos los ficheros de licencia, etc.. Cuando se sube un fichero (en los cambios de estado <em>submitted<\/em>, <em>approved<\/em> y <em>made available<\/em>), se calcula autom\u00e1ticamente su valor hash, almacen\u00e1ndose en la tabla de bitstreams:<\/p>\n<pre>arvo.pdf   checksum: d4c4979a5f4f34f6158a2620f0d5710c (MD5)\r\n\r\nlicense_rdf   checksum: 603b6a1a20b0b67b338ea745cbacb74f (MD5)<\/pre>\n<p>\u00bfY qu\u00e9 sucede entonces ante la modificaci\u00f3n de un fichero? Para responder a esta pregunta, en primer lugar debemos aclarar que en DSpace un fichero en realidad no se modifica, sino que se sustituye por otro diferente (borr\u00e1ndose el antiguo o version\u00e1ndolo) calcul\u00e1ndose autom\u00e1ticamente el hash del nuevo fichero y gener\u00e1ndose una nueva entrada en la tabla de bitstreams. Con este proceso se asegura que la integridad de cada fichero queda reflejada en la tabla bitstreams.<\/p>\n<p>Parte de esta informaci\u00f3n se graba adicionalmente en el metadato <em>dc.description.provenance. <\/em>Importante tener en cuenta que este metadato s\u00f3lo se graba en la subida inicial del fichero, no en las acciones de borrado o sustituci\u00f3n de fichero que pudieran ser realizadas posteriormente por un administrador.<\/p>\n<table class=\"ds-includeSet-table detailtable table table-striped table-hover\">\n<tbody>\n<tr class=\"ds-table-row odd \">\n<td class=\"label-cell\">dc.description.provenance<\/td>\n<td class=\"word-break\">Submitted by xxxxxx\u00a0 (name@mail.com) on 2008-02-11T11:46:16Z No. of bitstreams: 1 RSCAS_DL_2005.pdf: 185727 bytes, checksum: 4d46d9280e930bf6a024f6d39f3a74bb (MD5)<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Existe adem\u00e1s el comando <em>checker\u00a0<\/em> (cuya ejecuci\u00f3n se programa normalmente a intervalos regulares mediante crons) que permite comprobar que los hash de los ficheros no han cambiado y cuyo resultado y fecha de ejecuci\u00f3n se almacenan en la tabla <em>ckecksum_history<\/em>:<\/p>\n<pre>[dspace]\/bin\/dspace checker<\/pre>\n<p>Adicionalmente, podr\u00edamos rese\u00f1ar que en los logs de DSpace se registran las acciones realizadas sobre los bitstreams (a\u00f1adir nuevos y borrar los existentes) y los usuarios que las han realizado. Pero hay que se\u00f1alar que interpretar los logs directamente es una tarea bastante ardua que requiere del an\u00e1lisis de ingentes cantidades de datos sobre la historia\/logs del repositorio. Una v\u00eda que no nos atrever\u00edamos a recomendar.<\/p>\n<p>En caso de detectarse la alteraci\u00f3n o alg\u00fan problema con un fichero, se deber\u00e1 recurrir a un backup del assetstore\u00a0 (o mas infrecuentemente, backups AIP).\u00a0 Este no es un proceso de DSpace propiamente dicho, sino de las pol\u00edticas de recuperaci\u00f3n de cada repositorio. Cada repositorio deber\u00e1 plantearse los modos y medios de recuperaci\u00f3n de la informaci\u00f3n ante eventuales p\u00e9rdidas.<\/p>\n<p>Finalmente, se\u00f1alar que DSpace no comprueba la existencia de virus en los ficheros de forma est\u00e1ndar, pero mediante la implantaci\u00f3n de<em> <a href=\"http:\/\/www.arvo.es\/productos\/144-m%C3%B3dulo-de-preservaci%C3%B3n-digital\">m\u00f3dulos espec\u00edficos<\/a><\/em> es posible analizar los ficheros del repositorio en busca de virus, avisando a publicadores y administradores de potenciales riesgos en sus ficheros y eventualmente restringiendo el archivo de los mismos.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>La preservaci\u00f3n y la integridad de los ficheros almacenados en un sistema Dspace preocupan con frecuencia, y con raz\u00f3n, a los gestores de los repositorios. Intentaremos despejar las dudas m\u00e1s frecuentes sobre el comportamiento del software DSpace al respecto. Una &hellip;<\/p>\n<p class=\"read-more\"><a href=\"https:\/\/www.arvo.es\/dspace\/preservacion-e-integridad-de-ficheros-en-dspace\/\">Leer m\u00e1s &raquo;<\/a><\/p>\n","protected":false},"author":4,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[6],"tags":[92,91],"class_list":["post-1777","post","type-post","status-publish","format-standard","hentry","category-documentacion_tecnica","tag-integridad","tag-preservacion"],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/www.arvo.es\/dspace\/wp-json\/wp\/v2\/posts\/1777","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.arvo.es\/dspace\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.arvo.es\/dspace\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.arvo.es\/dspace\/wp-json\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/www.arvo.es\/dspace\/wp-json\/wp\/v2\/comments?post=1777"}],"version-history":[{"count":6,"href":"https:\/\/www.arvo.es\/dspace\/wp-json\/wp\/v2\/posts\/1777\/revisions"}],"predecessor-version":[{"id":1813,"href":"https:\/\/www.arvo.es\/dspace\/wp-json\/wp\/v2\/posts\/1777\/revisions\/1813"}],"wp:attachment":[{"href":"https:\/\/www.arvo.es\/dspace\/wp-json\/wp\/v2\/media?parent=1777"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.arvo.es\/dspace\/wp-json\/wp\/v2\/categories?post=1777"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.arvo.es\/dspace\/wp-json\/wp\/v2\/tags?post=1777"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}