Usted está aquí: Inicio Ingeniería Informática Recuperación y Acceso a la Información Autoevaluación Autotest Bloque 1

Autotest Bloque 1

Acciones de Documento
  • Vista de contenidos
  • Marcadores (bookmarks)
  • Exportación de LTI
Autores: Jorge Luis Morato Lara, Vicente Palacios Madrid
Autotest BLOQUE 1. Recuperación en Internet

Pregunta 1

Indique la respuesta correcta en relación a los tipos de Web.

a. Existen distintos tipos de web, como la web de datos, la web 1.0, la web social, la web profunda y la web semántica

b. Actualmente nos encontramos en la web 2.6

c. La web semántica hace inservible los demás tipos de Web

d. La web semántica se centra en dar semántica a los usuarios de la web 2.0


Pregunta 2

Indique la respuesta correcta

a. En el ciclo de BigData la fase de enriquecimiento es la que muestra la rentabilidad del proyecto

b. La limpieza consiste en técnicas centradas en eliminar los registros que contienen difamaciones e insultos

c. La limpieza consiste en eliminar errores ortográficos, tipográficos y datos inexactos

d. Enriquecimiento y limpieza son tareas que se implementan de forma rápida y sin apenas coste, por lo que merece la pena incluirlas en los proyectos


Pregunta 3

Los sistemas pregunta respuesta

a. Son una alternativa a la web automatizada que remunera a algunos usuarios por responder consultas

b. Pueden precisar de herramientas PLN, ontologías, reglas heurísticas (obtenidas manualmente o por inteligencia artificial) y bancos de consultas realizadas en el pasado

c. Son el futuro de todo Internet, y harán inservibles todas las páginas web actuales

d. Es un proyecto que pretende ser implantado en el futuro, pero en el que buscadores como Google o el propio de iOS no han implementado hasta el momento


Pregunta 4

En posicionamiento

a. Los factores indirectos son los que tienen un impacto sobre los directos, por ejemplo aumentando el número de visitas potenciales de la página

b. El PageRank es una medida de la credibilidad de una página otorgada por el W3C (WorldWideWeb Consortium)

c. Una página con muchos enlaces entrantes siempre es más creíble

d. Los principales criterios que considera Google para mostrar una página en primera posición en los resultados es el número de visitas que esta tiene y el importe que pagan sus propietarios a Google para aparecer en esta posición


Pregunta 5

Un crawler

a. Solo existen en sistemas que implementan el modelo booleano

b. Son sistemas que mediante inteligencia artificial determinan el mínimo recorrido para escoger las páginas más relevantes

c. Es aconsejable que sea distribuido, escalable, eficiente y extensible, pero sin dejar de ser robusto y respetuoso con la política del sitio

d. El fichero robots.txt es una alternativa a los crawlers


Pregunta 6

En el BigData

a. Es irrelevante la calidad de los datos ya que en caso de ser escasa se puede compensar con el tratamiento de un mayor volumen de datos

b. El mayor coste de un proyecto BigData es el análisis de datos

c. La integración de distintas fuentes de datos no es precisa en los proyectos BigData, ya que se trata de datos homogéneos, muy estructurados y procedentes de una única fuente de datos

d. La mayoría de los proyectos BigData fallan por una planificación deficiente


Pregunta 7

Las bases de datos BigData

a. Garantizan las cuatro propiedades ACID en las transacciones con la base de datos (atomicidad, consistencia, secuencialidad y durabilidad de las transacciones)

b. Como sistema de cómputo distribuido, se pueden garantizar los tres criterios del teorema CAP simultaneamente (Consistencia, Disponibilidad y Tolerancia a particiones)

c. Una base de datos NoSQL, como su nombre indica, no permite interrogar en el lenguaje de consulta SQL

d. Cassandra, MongoDB y CouchDB son bases de datos NoSQL


Pregunta 8

Para limpiar los registros es preciso:

a. Analizar manualmente los registros uno por uno, validándolos según un recurso de referencia externo

b. Distancia de edición, similitud fonética y frecuencia de subcadenas (p.e. con fingerprint) son técnicas frecuentemente utilizadas para limpiar registros

c. La limpieza de registros no es necesaria en BigData, ya que el gran volumen de datos procesado hace innecesario eliminar unos pocos registros con errores

d. Utilizar trabajadores reclutados por Internet (crowdsourcing) para limpiar registros es una técnica que ha demostrado ser ineficaz


Pregunta 9

Indique que característica de RDF es correcta:

a. Es un lenguaje de programación similar a Java que permite acceder más velozmente a los datos que con una base de datos relacional

b. Son tripletas para expresar hechos con la forma

c. El lenguaje específico e idóneo para interrogar RDF es SQL

d. Si bien es una alternativa prometedora, no existen apenas recursos en Internet expresados en RDF


Pregunta 10

Indique la opción correcta en relación al lenguaje SPARQL:

a. Las tripletas son siempre simétricas en su significado, así "?pais dbo:leaderTitle ?gobernante" tiene una redacción equivalente a "?gobernante dbo:leaderTitle ?pais"

b. El elemento "FILTER regex(?x, “^p”, “i”)" significa que solo debe mostrar los registros que empiecen por x, contengan una p y una i es su cadena.

c. El elemento OPTIONAL indica que su contenido puede ser ignorado por no ser relevante para nuestra necesidad de información

d. Existen cuatro tipos básicos de consultas: SELECT, CONSTRUCT, ASK y DESCRIBE


Reutilizar Curso
Descargar este curso