1. A requerimiento de Dolors Reig, tutora de la asignatura Educación y
aprendizaje en la tercera década de la web. los llevare a adentrarnos al
mundo Semántico y conocer una de las herramientas denominada
DBpedia que ha revolucionado el sistema de consultas…
Continuamos :
Carmen Chevalier
2.
3. Esta versión semántica de Wikipedia surge en el 2007 de la colaboración de
la Universidad Libre de Berlín, la Universidad de Leizpig y OpenLink
Software.
Consiste en la extracción de información estructurada de Wikipedia para
publicarla de forma abierta, mediante lo que llamamos Linked data.
Mediante DBPedia podemos:
• Consultar de forma más sofisticada (SPARQL)¹.
• Tener la posibilidad de que otras colecciones enlacen sus datos
directamente con los contenidos de Wikipedia.
1, SPARQL: es un acrónimo recursivo del inglés SPARQL Protocol
and RDF Query Language. Se trata de un lenguaje estandarizado
para la consulta de grafos RDF, normalizado por el RDF Data Access
Working Group (DAWG) del World Wide Web Consortium (W3C). Es
una tecnología clave en el desarrollo de la Web Semántica que se
constituyó como Recomendación oficial del W3C el 15 de Enero de
2008
http://dataweb.infor.uva.es/wp-content/uploads/2012/03/curso5a.pdf
4. DBPedia aprovecha la información estructurada existente en Wikipedia, la
cual es extraída y puesta en disposición de la World Wide Web (www), lo
cual permite a los usuarios obtener respuesta a preguntas donde la
información se extiende por muchos artículos.
La globalidad de la información representada en Wikipedia,
facilita que esta puede ser utilizada como complemento al
contenido de una Web.
Cualquier página puede programar una consulta SPARQL en su
cuerpo y recuperar información especifica desde el endpoint--²
de DBpedia.
2. Endpoint: continúa el trabajo donde se detienen la detección y la prevención
de la fuga de información (DLP) en la red, proporcionando seguridad y control
en el endpoint de lo que se considera información confidencial y dónde debe
almacenarse (a través de la detección local)
http://es.knowledger.de/00197582/DBpedia
http://dataweb.infor.uva.es/wp-content/uploads/2012/03/curso5a.pdf
http://www.websense.com/content/Regional/LatAm/DataEndpoint.aspx
5. 3,64 millones de cosas procedentes de 97 idiomas diferentes.
1,83 millones clasificadas de acuerdo a una ontología consistente:
526.000 lugares (contenido geográfico).
416.000 personas.
183.000 especies.
169.000 organizaciones.
106.000 discos de música.
60.000 películas.
5.400 enfermedades.
http://dataweb.infor.uva.es/wp-content/uploads/2012/03/curso5a.pdf
6. El objetivo de DBPedia es ofrecer a los usuarios una forma de búsqueda
mas especifica con un formato de datos conocidos para todos, pero sin
dejar atrás la sincronización de estos datos con Wikipedia.
Así mismo los usuarios tienen acceso a datos usando un SQL³ - como la
lengua de la pregunta para RDF4 el cual es el Marco de la descripción del
recurso.
3. SQL: (por sus siglas en inglés structured query language) es un
lenguaje declarativo de acceso a bases de datos relacionales que
permite especificar diversos tipos de operaciones en ellas.
4, RDF: es un framework para metadatos en la World Wide Web (WWW),
desarrollado por el World Wide Web Consortium (W3C).
7. • Etapas de extracción que buscaban vínculos entre las diferentes ediciones de
Wikipedia fueron sustituidos por otros más potentes de post-procesamiento.
• El tiempo de preparación y esfuerzo para la extracción de datos se reduce al
mínimo, el tiempo de extracción se reduce a unos pocos milisegundos por
página.
• Para ahorrar espacio del sistema de archivos, el marco puede comprimir
archivos DBpedia triples y descomprimir archivos de volcado de Wikipedia XML
al leer.
• Con un poco de cambio de bit, ahora podemos cargar entre 200 millones de
lenguaje de enlaces en unos cuantos GB de RAM y analizarlos.
8. DBpedia contiene información sobre numerosas localizaciones geográficas
con sus coordenadas. Esta información está enlazada con colecciones como
Geonames5, el US Census6, Euro Stat7, entre otros.
Los dispositivos móviles poseen infraestructura GPS, por lo que cuentan con
una búsqueda espacial para la implementación de aplicaciones de
localización, como lo hace DBPedia.
5, GeoNames: es una base de datos geográfica gratuita y accesible a través de Internet bajo
una licencia Creative Commons Reconocimiento 3.0.
6. US Census: Es el organismo gubernamental que se encarga del
Censo en los Estados Unidos.
7. Euro Stat: es la oficina estadística de la Comisión Europea, que
produce datos sobre la Unión Europea y promueve la armonización de
los métodos estadísticos de los estados miembros.
http://dataweb.infor.uva.es/wp-content/uploads/2012/03/curso5a.pdf
http://es.wikipedia.org/wiki/GeoNames
9. Aquí vemos una de las
herramientas con la que
podemos realizar búsquedas en
DBPedia, específicamente, la
interfaz de SPARQL, el cual
funciona como una lengua de
consulta, un formato para la
respuesta y un medio para el
transporte de consultas y
respuestas.
11. Una forma fácil y rápida de hacer consultas con ventajas de tener
excelentes resultados es de la manera siguiente, la consulta que
haremos es buscar cuales toreros están casados con cantantes de
coplas; lo primero que tenemos que hacer es entrar al sistema de
DBPedia.
Es.dbpedia.org
Después de
haber copiado
el formato a
consultar
abrimos el Copiamos
editor de
consultas
SPARQL, en
este link que
indicamos.
13. Y por ultimo en la misma
ventana del editor
SPARQL, damos clic a
“Run Query”, que en
español es lo mismo a
“Ejecutar consulta”
14. Y aquí tenemos el
resultado, los nombres
de los toreros
conjuntamente con las
cantantes de coplas.
15. Si queremos verificar los
resultados de las
consultas y ver la
información mucho mas
amplia y concreta, solo
tenemos que dar clic al
que queramos verificar.
en este caso vamos a ver
el primer resultado,
16. Al dar clic a los resultados obtenidos anteriormente, tendremos esta ventana, la
cual nos ofrece toda la información que necesitamos respecto a nuestro
requerimiento.
Aquí tenemos
nombre del Cantante
Torero de copla
A parte de eso
podremos encontrar
el lugar y año de
su nacimiento,
ocupación, entre
otras
informaciones.
17. Según avanzamos nos inclinan por herramientas que le den resultados
factibles y rápidos, por tal razón DBPedia esta revolucionando el sistema
de búsqueda en cuanto a sistema semántico se refiere.
Esta versión semántica nos impulsa adentrarnos cada vez mas a enlazar
conocimientos y ofrecer artículos de toda categoría permitiendo así
resultados sencillos a requerimientos complejos.
Bibliografía:
Imágenes y datos tomados de Google Chrome, con referencia al pie de
cada una de las presentaciónes