Políticas del repositorio

CIC-DIGITAL es el Repositorio Institucional de la Comisión de Investigaciones Científicas de la Provincia de Buenos Aires creado en el año 2014 por la resolución 1146 para constituirse como el portal de acceso central que reúna toda la producción científico-tecnológica y académica generada en el ámbito de la CICBA y para dar a sus creaciones una mayor visibilidad, aumentar su uso e impacto y asegurar su acceso y preservación a largo plazo. El repositorio CIC-DIGITAL adhiere a la Iniciativa de Acceso Abierto que sustenta el principio de la libre disposición de la información.

El repositorio funciona en consonancia con la Ley número 26.899 de “Creación de Repositorios Digitales Institucionales de Acceso Abierto, propios o compartidos” plantea que: “los organismos e instituciones públicas que componen el Sistema Nacional de Ciencia, Tecnología e Innovación (SNCTI), y que reciben financiamiento del Estado nacional, deberán desarrollar repositorios digitales institucionales de acceso abierto, propios o compartidos, en los que se depositará la producción científico-­tecnológica resultante del trabajo, formación y/o proyectos, financiados total o parcialmente con fondos públicos, de sus investigadores, tecnólogos, docentes, becarios de posdoctorado y estudiantes de maestría y doctorado”.

CIC-Digital está regido por distintas políticas institucionales creadas para, entre otras cosas, definir el tipo y características del contenido alojado en el repositorio, los derechos inherentes a los autores del contenido, los usos del contenido de acuerdo a la voluntad de los autores, las acciones a definirse para la preservación del contenido, y las distintas estrategias llevadas a cabo para aumentar la visibilidad de toda la producción de CICBA.

Las políticas son sometidas regularmente a revisión y se dividen en distintos aspectos, entre ellos:

Política de contenidos

CIC-DIGITAL recibe la producción de toda la CICBA en sus actividades de investigación y extensión. Los materiales a incorporar en el repositorio deben cumplir con al menos uno de los siguientes requisitos:

  • ser editados y publicados en el ámbito de la institución,
  • ser generados por docentes y/o investigadores, personal de apoyo, becarios y cualquier otro dependiente de la CICBA o centros asociados,
  • provenir de la CICBA, ya sea su dependencia central o centros,
  • que constituyan documentación relevante en cuanto al funcionamiento a fin de transparentar los procesos y el uso de recursos destinados a Ciencia y Tecnología en la Provincia de Buenos Aires.

Excepcionalmente podrá también albergar materiales que, aunque no estén producidos en la institución, su preservación revista una importancia singular en razón de su valor histórico-cultural . Las obras depositadas pueden estar en cualquier idioma, siendo español, portugués e inglés los más relevantes.

De acuerdo a lo precedente algunas de las tipologías aceptadas son: Informes de Investigador, Personal de Apoyo y Becarios, tesis de grado y posgrado, artículos científicos en cualquiera de sus versiones (preprint, postprint o versión del editor), artículos de divulgación, libros y capítulos de libro, presentaciones en congresos, producciones artísticas, imágenes, grabaciones audiovisuales, publicaciones periódicas, mapas, patentes y reseñas (que hayan pasado por un proceso de evaluación). También se incorporarán al repositorio, otros tipos de documentos como, informes técnicos, proyectos de investigación, legislación institucional: ordenanzas y reglamentos, convocatorias, actas de directorio, resoluciones, acuerdos/convenios, planes anuales de Actividades, entre otros.

El repositorio acepta los formatos de archivo más comúnmente utilizados como PDF, Word y Powerpoint, aunque por razones de accesibilidad y preservación digital recomienda el uso de formatos abiertos como ODT, RTF, TIFF y JPEG frente a formatos propietarios (Word, GIF, etc) y realiza actividades de transformación a formatos reconocidos como óptimos para la tarea de preservación como es el caso de PDF-A.

Política de acceso a datos

Las obras alojadas en el repositorio pueden ser visualizadas y descargadas de forma libre y gratuita, sin necesidad de registro o autorización previa, siempre respetando las condiciones expuestas en las licencias de uso adosadas a las mismas. Los autores o titulares de la propiedad intelectual de cada obra definen en el momento de depósito una licencia de uso, que explicita los usos permitidos para los usuarios y para el repositorio. Los usos que se pueden definir son:

  • si se permite uso comercial o no,
  • si se permiten obras derivadas, es decir, derivadas aquellas obras creadas a partir de la licenciada, como por ejemplo: las traducciones y adaptaciones; las revisiones, actualizaciones y anotaciones; los compendios, resúmenes y extractos; los arreglos musicales y, en general, cualesquiera transformaciones de una obra literaria, artística o científica,
  • si, en caso de permitir obras derivadas, las mismas deben mantener idéntica licencia que la obra original.

Las licencias de uso permitidas en el repositorio pertenecen a la familia Creative Commons que habilitan la descarga, el uso y compartición de los contenidos siempre que se mencione la obra y al autor original. En el caso particular de CIC-Digital y para las obras existentes en el ámbito de la CICBA, estén estas en formato papel o en digital, son publicadas con una licencia "Creative Commons BY 2.5" o más novedosas. Para el caso de artículos ya publicados por los autores en revistas que tienen condiciones de contrato que contemplan embargos o similares, el personal del repositorio revisa en bases de datos tales como SHERPA/RoMEO.

Politica de depósito

Debido a la naturaleza distribuida de los centros y los investigadores de CICBA, el repositorio se sustenta en un modelo distribuido de trabajo mediante el cual pueden existir diferentes vías de depósito:

  • Circuito de Autoarchivo: en este circuito los investigadores suben al repositorio sus obras y realizan una precarga de metadatos. Luego, un revisor se encarga de validar y expandir dichos metadatos y de la publicación del recurso.
  • Circuito de carga de obras retroactivas: desde la gestión central del repositorio o desde centros que realicen tareas de digitalización, se cargan los documentos digitalizados.
  • Circuito de carga descentralizado: consiste en delegar los permisos y responsabilidad de carga en responsables seleccionados de cada centro. También se podrán incorporar obras a partir de importaciones desde otros sistemas de gestión como ser el Sistema de gestión de proyectos de la CICBA, catálogos en línea (SCOPUS y otros) o repositorios de otras instituciones con material de CICBA.

En todos los casos corresponden al repositorio las tareas de revisión, descripción normalizada y publicación o veto de la obra. Solamente se vetarán los trabajos que no cumplan con las condiciones mínimas establecidas en las políticas de contenidos arriba mencionadas.

Los trabajos pueden ser depositados en cualquier momento y hacerse públicos de manera inmediata o diferida luego de la finalización de un período elegido por el autor denominado período de embargo. Dicha modalidad de publicación será utilizada solo en caso que las obras estuvieran protegidas por derechos de propiedad industrial y/o acuerdos previos con terceros, los autores podrán solicitar un período de embargo, plazo durante el cual sólo serán públicos los metadatos de la obra pero no su contenido. Asimismo, se podrá establecer un período de embargo en caso que las obras incluyan resultados de investigación pendientes de ser publicados o patentados; en tal caso el período de embargo nunca podrá ser superior a los 2 años.

Los autores afirman ser los titulares de los derechos patrimoniales de las obras depositadas y por tanto asumen toda responsabilidad ante infracciones de la ley de propiedad intelectual.

Sobre la permanencia de las obras en el repositorio: El repositorio se compromete a quitar una obra de circulación ante una demanda de violación de derechos de propiedad intelectual. De ser necesario el autor puede subir una versión actualizada de una obra propia para usar como reemplazo o complemento de la previamente depositada.

Política de preservación digital

Las Directrices para la preservación del patrimonio cultural de UNESCO plantean la salvaguarda del patrimonio documental a partir de la garantía a largo plazo de preservación y acceso. En este sentido, el primer paso en cuanto a preservación es tener un plan claro que determine qué materiales se conservarán, por qué plazo, con qué tecnologías y con cuáles procedimientos periódicos de control . Los objetos digitales no existen sin una mediación tecnológica, la cual puede volverse obsoleta en el tiempo, en este sentido el planeamiento de la preservación requiere la vigilancia durante todo el ciclo de vida de los objetos digitales. Dicha vigilancia contempla por un lado el agregado de metadatos necesarios para asegurar la trazabilidad durante todo el ciclo de vida del objeto y por otro el monitoreo de los formatos y las tareas de migración que resulten necesarias.

Es necesario el debido conocimiento de la procedencia del objeto digital, así como también quiénes han realizado cambios sobre el mismo, si es auténtico, cómo se relaciona con otros objetos digitales, los aspectos técnicos que permitan su acceso y los derechos que autorizan a realizar los cambios necesarios para asegurar su acceso y legibilidad. Dentro del repositorio, cada objeto se considera en el marco de un paquete de información tal cual plantea el modelo OAIS, es decir, como un contenedor constituido por: información de contenido (objeto, representación del objeto), información de preservación (procedencia, contexto, integridad, referencia y derechos) e información descriptiva. El plan de preservación digital regirá el funcionamiento del repositorio y se construirá en función de las mencionadas directrices UNESCO, la norma OAIS y otras iniciativas internacionales que dan soporte a la preservación.

Otras tareas regulares que se cumplen en pos de la preservación en el repositorio son:

  • Backups periódicos en servidores externos
  • Vigilancia y conversión de formatos de archivo
  • Actualización del software que sustenta al repositorio
  • Comprobaciones periódicas de la integridad de los archivos para asegurar que la obra no ha sufrido alteraciones
  • Inclusión de una URL persistente Handle.net para la identificación y localización inequívoca de la obra

Las obras pueden ser removidas a solicitud del autor o titular de los derechos patrimoniales si se esgrimen algunos argumentos como los siguientes:

  • Reglas de los editores
  • Violación comprobada del derecho patrimonial
  • Requerimientos legales y violaciones probadas
  • Seguridad nacional
  • Investigación falsificada

Los ítems retirados no son removidos del repositorio, pero sí de la vista pública.

Política de metadatos

Los metadatos son la información descriptiva que se aplica sobre un recurso para facilitar su organización, recuperación, preservación e interoperabilidad. Para catalogar una obra, el repositorio utiliza un perfil de aplicación dependiente de la tipología documental basado en DCMI Metadata Terms, ETD y extensiones propias.

Todos los registros de metadatos de las obras depositadas en el repositorio son diseminadas a partir del protocolo de interoperabilidad OAI-PMH usando diferentes perfiles de aplicación del esquema de metadatos DC Element Set. Al momento se han implementado 3 perfiles de aplicación basados en las directrices OpenAire 3.0, las directrices SNRD 2015 y un perfil propio. El acceso a estos metadatos es libre y gratuito, y se fomenta su reuso en cualquier medio sin permisos previos, bajo la condición de mantener el identificador/enlace persistente (Handle) al registro original de metadatos disponible en el portal http://digital.cic.gba.gob.ar.

Política de digitalización

Como guía para el proceso de digitalización se utilizará las directrices definidas en el documento "Technical Guidelines for Digitizing Cultural Heritage Materials" generado en 2010 por la Federal Agencies Digitization Guidelines Initiative (FADGI). También se utilizarán como referencia otros documentos muy avalados para digitalización que son válidos aunque más antiguos:

  • "Directrices para proyectos de digitalización de colecciones y fondos de dominio público" ,IFLA (2002).
  • "Technical Guidelines for Digitizing Archival Materials for Electronic Access: Creation of Production Master Files ­ Raster Images" , NARA (2004).
  • “Recomendaciones para la digitalización de los documentos en archivos”. Junta de Castilla y León (2011).

De cada obra digitalizada se tendrá al menos 3 versiones:

  1. imagen maestra resultante del escaneo,
  2. documento maestro con imagen derivada de la anterior y el OCR generado sobre ella y
  3. otra(s) derivada(s) a los fines de uso y distribución en la web.

La resolución de las imágenes maestras (a) estará determinada por el estado y el tipo del material a digitalizar. El formato será:

  • TIFF/JPEG2000 sin compresión para documentos escaneados a partir escaneo reflectivo tradicional. El formato dependerá del modelo del escáner.
  • RAW/JPEG para documentos escaneados a partir de captura fotográfica (ej. DIY scanner).

Una vez se disponga de la imagen maestra en alta calidad, se le aplicarán transformaciones para lograr un documento (b) en formato para preservación a largo plazo PDF/A. Estas transformaciones incluyen al menos las siguientes acciones/etapa:

  1. Rotación
  2. Alineación
  3. Ajuste de márgenes
  4. Limpieza (de puntos y manchas)
  5. Selección de contenido: texto e imágenes
  6. Proceso de OCR sobre las secciones de texto
  7. Revisión y corrección de OCR
  8. Generación de archivo final

Las etapas 1 a 4 se realizan utilizando un software de código libre llamado ScanTailor. Las siguientes etapas, 5 a 8, se realizan utilizando un software licenciado llamado Abbyy Fine Reader. Según las posibilidades del software de transformación se generará un PDF/A (ISO 19005) o PDF/A­2 (ISO 32000­1).

Siempre que sea posible, se generarán formatos PDF/A­a y PDF/A­2a dado que garantizan la accesibilidad, correcta visualización y permite preservar las características estructurales del documento y el OCR generado. En cambio, si no fuese posible se generará PDF/A­b o PDF/A­2b. En cuanto a los archivos en versión derivada (c), se utilizará el mismo documento en PDF/A o en alguna versión de PDF que permita reducir el tamaño.

Se estudiará en determinados casos, la conveniencia de transformación de estos documentos al formato DjVU que también mantiene el OCR y la imagen en buena calidad, aunque con mejores 6 niveles de compresión que PDF, es decir, con menor tamaño de archivo final.

Politica de Servicios

Servicios para usuarios:

  • Acceso público a contenidos desde el portal a partir de búsqueda y navegación, documentos destacados y listado de últimos recursos agregados.
  • Exposición de procedimientos internos a partir de recursos disponibles en el repositorio y de páginas complementarias: instructivos, manuales, preguntas frecuentes, ayuda, entre otros.
  • Soporte a usuarios vía email, telefónica o presencial.

Servicios para autores:

  • Asesoría en cuestiones de políticas de autoarchivo de las editoriales.
  • Links a sitios especiales: DOAJ, SHERPA/RoMEO
  • Participación en talleres sobre acceso abierto.