Normalización automática de registros obtenidos de la Web of Science
Texto completo:
http://www.uniovi.net/ICE/public ...Ver/ Abrir
Nivel Educativo:
Tipo Documental:
Artículo de revistaEstadísticas:
Ver Estadísticas de usoMetadatos:
Mostrar el registro completo del ítemFecha:
2012Publicado en:
Aula abierta. 2012, v. 40, n. 2 ; p. 65-74Resumen:
Los lenguajes de programación orientados al tratamiento automático de textos ya han demostrado anteriormente su utilidad para procesar y gestionar los registros bibliográficos obtenidos de diferentes bases de datos. Concretamente el lenguaje Perl ha sido utilizado en numerosas metodologías relacionadas con la bibliometría, para extraer los diferentes elementos de los registros bibliográficos, incorporarlos a bases de datos relacionales, procesarlos y obtener de ellos múltiples indicadores. Este trabajo tiene como objetivo el desarrollo de un sistema de normalización de datos, basado en scripts de Perl y en algoritmos de similaridad, que nos permitan realizar una normalización básica sobre los nombres de autor, direcciones y palabras clave procedentes de los registros obtenidos a través de la Web of Science. El procedimiento posee un margen de error muy pequeño y es especialmente eficiente en los nombres de instituciones, permitiendo eliminar más del 60 por ciento de la redundancia en este campo, un 10 por ciento en el caso de los nombres de autor y alrededor de un 50 por ciento en cuanto a las palabras clave.
Los lenguajes de programación orientados al tratamiento automático de textos ya han demostrado anteriormente su utilidad para procesar y gestionar los registros bibliográficos obtenidos de diferentes bases de datos. Concretamente el lenguaje Perl ha sido utilizado en numerosas metodologías relacionadas con la bibliometría, para extraer los diferentes elementos de los registros bibliográficos, incorporarlos a bases de datos relacionales, procesarlos y obtener de ellos múltiples indicadores. Este trabajo tiene como objetivo el desarrollo de un sistema de normalización de datos, basado en scripts de Perl y en algoritmos de similaridad, que nos permitan realizar una normalización básica sobre los nombres de autor, direcciones y palabras clave procedentes de los registros obtenidos a través de la Web of Science. El procedimiento posee un margen de error muy pequeño y es especialmente eficiente en los nombres de instituciones, permitiendo eliminar más del 60 por ciento de la redundancia en este campo, un 10 por ciento en el caso de los nombres de autor y alrededor de un 50 por ciento en cuanto a las palabras clave.
Leer menos