Plataforma de recolección en fuentes heterogéneas de la web y su aplicación a la organización de un repositorio semántico en SeDiCI: preliminares

cic.isFulltexttruees
cic.isPeerReviewedtruees
cic.lugarDesarrolloUniversidad Nacional de La Plata es
cic.versioninfo:eu-repo/semantics/publishedVersiones
dc.date.accessioned2016-08-11T15:55:33Z
dc.date.available2016-08-11T15:55:33Z
dc.identifier.urihttps://digital.cic.gba.gob.ar/handle/11746/3586
dc.titlePlataforma de recolección en fuentes heterogéneas de la web y su aplicación a la organización de un repositorio semántico en SeDiCI: preliminareses
dc.typeDocumento de conferenciaes
dcterms.abstractPresentation of a web collection platform designed to relate and unify information available on different standard web sources with a view to creating a user-browseable thematic repository.\nThe platform will be used at the Servicio de Difusión de la Creación Intelectual (SeDiCI) [Intellectual Creation Diffusion Service] combined with ontologies and thesaurus to provide improved data sorting.\nData is currently spread on web resources and traditional search engines return ranked lists with no semantic relation among documents. Users have to spend a great deal of time relating documents and trying to figure out which ones fully address the issue domain. It is only after locating similarities and differences that information fragments are applied to the user's work, enabling knowledge creation.\nThe proposed platform sorts out the different theme domain functioning modules to allow their use in various knowledge areas. Development includes two agents that searches data base stored URLs, one is capable of identifying bookmarked pages, interpreting labels and providing rules for extracting information and storing it in a RDF data file; on the other hand, the other agent is in charge of getting related URLs from the given one. After this stage, homogenization is applied and transformed information is sorted out according to domain ontologies.\nThe platform allows for more efficient automatic extraction processes and information search among heterogeneous sources that represent the same concepts using different standards.en
dcterms.abstractSe presenta una plataforma de recolección destinada a relacionar y unificar información disponible en distintos lugares de la Web-que siguen diferentes convenciones-para crear un repositorio temático que puedan navegar los usuarios. La plataforma será usada en el Servicio de Difusión de la Creación Intelectual (SeDiCI) y utiliza de manera combinada ontologías y tesauros para brindar información mejor clasificada.\nActualmente, la información está diseminada en recursos de la Web y los motores de búsqueda tradicionales le devuelven al usuario listas rankeadas sin proveer ninguna relación semántica entre documentos. Los usuarios pasan gran cantidad de tiempo para vincular unos documentos con otros y saber cuáles atacan el dominio completo del problema; recién al localizar las semejanzas y las diferencias entre fragmentos de información éstas se trasladan a su trabajo y sirven para la creación de nuevo conocimiento.\nLa plataforma propuesta separa los módulos de funcionamiento de los diferentes dominios de interés (temas) para permitir su utilización en distintas áreas de conocimiento. El desarrollo incluye dos agentes que recorren las URLs almacenadas en una base de datos (uno responsable de poblar una ontología y otro de obtener URLs relacionadas), un módulo capaz de reconocer las páginas marcadas, interpretar las etiquetas y proveer las reglas para extraer la información y guardarla en un fichero RDF; tras esta etapa se aplica una homogeneización y la información así transformada se clasifica en función de una ontología de dominio.\nLa plataforma vuelve más eficientes los procesos de extracción automática y búsqueda de información en fuentes heterogéneas que representan los mismos conceptos siguiendo distintas convenciones.es
dcterms.creator.authorDe Giusti, Marisa Raqueles
dcterms.creator.authorSobrado, Arieles
dcterms.creator.authorVosou, Agustínes
dcterms.creator.authorVillarreal, Gonzalo Lujánes
dcterms.extent12 p.es
dcterms.isPartOf.issueIII Conferencia Internacional de Biblioteca Digital y Educación a Distanciaes
dcterms.isPartOf.seriesExpandiendo las fronteras del conocimiento (Mérida, Venezuela, 2009)es
dcterms.issued2009
dcterms.languageEspañoles
dcterms.licenseAttribution 4.0 International (BY 4.0)es
dcterms.subjectrepositorio semánticoes
dcterms.subjectontologíases
dcterms.subjecttesauroses
dcterms.subject.materiaCiencias de la Computación e Informaciónes
dcterms.subject.materiaBibliotecologíaes
Archivos
Paquete original
Mostrando1 - 1 de 1
Imagen en miniatura
Nombre:
Plataforma de recolección en fuentes heterogéneas.pdf-PDFA.pdf
Tamaño:
472.77 KB
Formato:
Adobe Portable Document Format
Descripción:
Documento completo