Exploring the challenge of linking scientific publications and studies with c...
Introduccion a Wikidata DSS Wikidata Editathon
1. Donostia - San Sebastián
Wikidata Editathon
#dssenwikidata
Evento organizado por investigadores de
Universität Koblenz-Landau
Universidad del País Vasco / Euskal Herriko Unibertsitatea
Universidad de Zaragoza
Con la colaboración de
Wikimedia España
Wikimedia Deutschland
Con la Colaboración de
Wikimedia
Introducción a Wikidata
Cristina Sarasua
WeST, Universität Koblenz-Landau
16. Wikipedia DSS ficha DE
Falta consistencia
Diferente cobertura de info en distintos idiomas
17. Visualización de datos por idiomas
Presentada por Markus Krötzsch en SWIB2014
y creada por Denny Vrandečić
http://swib.org/swib14/slides/kroetzsch_swib14_53.pdf
18. CONSULTA:
¿Cuál es el nombre de
pila del alcalde de la
ciudad de San
Sebastián?
Datos estructurados
San
Sebastián
Q10313
Q12256843
@es
P6
P1705
Eneko
P735
P1705 etiqueta; P31 instancia de; P6 jefe de gobierno; P735 nombre
Q515P31
19. CONSULTA:
¿Cuál es el nombre de
pila del alcalde de la
ciudad de San
Sebastián?
Datos estructurados
San
Sebastián
Q10313
Q12256843
@es
P6
P1705
Eneko
P735
P1705 etiqueta; P31 instancia de; P6 jefe de gobierno; P735 nombre
Q515P31
20. CONSULTA:
¿Cuál es el nombre de
pila del alcalde de la
ciudad de San
Sebastián?
Datos estructurados
San
Sebastián
Q10313
Q12256843
@es
P6
P1705
Eneko
P735
P1705 etiqueta; P31 instancia de; P6 jefe de gobierno; P735 nombre
Q515P31
21. CONSULTA:
¿Cuál es el nombre de
pila del alcalde de la
ciudad de San
Sebastián?
Datos estructurados
San
Sebastián
Q10313
Q12256843
@es
P6
P1705
Eneko
P735
P1705 etiqueta; P31 instancia de; P6 jefe de gobierno; P735 nombre
Q515P31
22. CONSULTA:
¿Cuál es el nombre de
pila del alcalde de la
ciudad de San
Sebastián?
Datos estructurados
San
Sebastián
Q10313
Q12256843
@es
P6
P1705
Eneko
P735
P1705 etiqueta; P31 instancia de; P6 jefe de gobierno; P735 nombre
Q515P31
CONSULTA:
¿Cuál es el edad media en la que escritores
donostiarras publican su primer libro?
23. ● +14Millones elementos
● +225Millones ediciones
● +15.000 usuarios activos
● idiomas de Wikipedia
Estadísticas de Wikidata
24.
25. Procedencia de las ediciones
Ver [Steiner,2014] para comparación Bots vs Wikidatans
Bots
edición automática
política de bots
enlaces interwiki, etiquetas, descripciones,
declaraciones, fuentes, items
Usuarios
edición manual
libertad
>>>
proyecto WIKIdata
27. ● Información editada, revisada por usuarios
humanos
● Herramientas que ayudan a la
comprobación automática
Calidad de los datos
Wikidata
Quality Team
fuente: http://blog.wikimedia.de/2015/03/13/improving-data-quality-on-wikidata-checking-what-we-have/
28. ● Información editada, revisada por usuarios
humanos
● Herramientas que ayudan a la
comprobación automática
Calidad de los datos
Wikidata
Quality Team
fuente: http://blog.wikimedia.de/2015/03/13/improving-data-quality-on-wikidata-checking-what-we-have/
29. Fuentes de referencia para los datos
https://tools.wmflabs.org/wikidata-todo/stats.php
30. ● P214: identificador de VIAF
● P1566: identificador de GeoNames
● P727: identificador de Europeana
Integración de datos
Q64
122530980
P214
(Berlin)
31. Integración de datos (II)
"Linking Open Data cloud diagram 2014, by Max Schmachtenberg, Christian Bizer, Anja Jentzsch
and Richard Cyganiak. http://lod-cloud.net/"
Existen otros esfuerzos por publicar datos
abiertos e integrarlos: Linked Open Data
33. ● Wikidata y DBpedia son proyectos diferentes con
cosas en común [Krötzsch, 2014]
○ Wikipedia
■ los dos tienen relación con Wikipedia
○ Identificadores
■ los dos utilizan URIs
○ Idiomas
■ Wikidata repositorio de datos multi-idioma
■ DBpedia repositorios separados (chapters) por idioma
○ Creación de datos
■ Wikidata edición manual
■ DBpedia extracción automática → problemas de calidad
● Wikidata integrada con datos de LOD, RDF dump,
consulta SPARQL
● Integración DBpedia - Wikidata
Integración de datos (III)
https://meta.wikimedia.org/wiki/Wikidata/Notes/DBpedia_and_Wikidata
34.
35. ● Base de conocimiento colaborativa
● Google compra Freebase a Metaweb
● Folksonomía
● Principalmente inglés
● Diferencias de implementación y comunidad
Freebase
37. Transferencia de Freebase a Wikidata
fuente:
https://plus.google.com/109936836907132434202/posts/bu3z2wVqcQc
38. Transferencia de Freebase a Wikidata
fuente:
https://plus.google.com/109936836907132434202/posts/bu3z2wVqcQc
HOY, 14:00
Thomas Steiner
(Google, Inc.)
40. Herramientas de apoyo a la edición
Ver: https://tools.wmflabs.org/wikidata-todo/tour.html#slide=0
wiki
usuario Wikidata
L E L
UI amigable Wikidata Game
L E
list generator
L E
navegador clases y
propiedades L E
L
mapas
41. Herramientas de apoyo a la edición
Ver: https://tools.wmflabs.org/wikidata-todo/tour.html#slide=0
wiki
usuario Wikidata
L E L
UI amigable Wikidata Game
L E
list generator
L E
navegador clases y
propiedades L E
L
mapas
42. Acceso y reutilización
Ver: https://www.wikidata.org/wiki/Wikidata:Data_access
Query APIs
- MediaWiki API
- Wikidata Query
Dereferencable
URIs
- MediaWiki API
- Interfaz Linked
Data
SW Query
- RDF dump
- SPARQL
endpoints
- LDF
L
L
L
47. Mejorar la gestión de Wikipedia
https://en.wikipedia.org/wiki/Category:Templates_using_data_from_Wikidata
Wikidata, como repositorio de datos de Wikipedia
48. Periodismo de datos
screenshot of Goole Charts: https://developers.google.com/chart/interactive/docs/gallery?hl=es
Data Journalism Handbook http://interactivos.lanacion.com.ar/manual-data/index.html
análisis e interpretación de datos
infografías
49. Open Science, Integración de datos
Ciencia ciudadana y ciencia profesional
Proyecto “Wikidata for research”
https://www.wikidata.org/wiki/Wikidata:WikiProject_Wikidata_for_research
59. Básicos de Wikidata (II)
https://www.wikidata.org/wiki/Wikidata:Introduction/es
60. ● Pueden referirse a
○ un tema (p.ej. política)
○ una clase (p.ej. ciudad)
○ una instancia, objeto concreto (p.ej. San Sebastián)
● Tienen que ser relevantes y únicos
● Borrado de páginas de elemento
(administradores)
Elementos
ayuda: https://www.wikidata.org/wiki/Help:Items/es
61. ● Etiquetas: nombre (único par etiq-desc)
○ empiezan por minúscula (salvo nombres propios
etc.)
○ desambiguación en descripción, no en etiqueta!
○
● Alias: otros nombres comunes
Etiquetas y alias
ayuda: https://www.wikidata.org/wiki/Help:Label/es
https://www.wikidata.org/wiki/Help:Aliases/es
https://www.wikidata.org/wiki/Help_talk:Label#No_page_in_English
63. ● propia página
● se pueden proponen, pero se supervisan, votan, y los
burócratas crean
● forman afirmaciones junto con valores
● autocompletado (muy útil)
● tipos de valor concretos (def. en propiedad)
○ elemento
○ enlace a Wikimedia Commons
○ texto
○ dato temporal
○ coordenada
○ URL
○ calificadores
Propiedades
https://www.wikidata.org/wiki/Help:Properties
64. ● La información que conocemos de los elementos
“San Sebastián, es una (instancia de), ciudad”
● Contienen: propiedad-valor + calificador
● Una propiedad puede tener múltiples valores
“Lola, ocupación, profesora”
“Lola, ocupación, investigadora”
● Declarar información que se pueda verificar (fuentes)
● Inconsistencia → ranking, consenso
● no enlazar con páginas desambiguación
Declaraciones
https://www.wikidata.org/wiki/Help:Statements/es
65. ● Para refinar información de una afirmación
“Lola, ocupación, profesora” durante 2005
Calificadores
https://www.wikidata.org/wiki/Help:Qualifiers/es
screenshot: https://www.wikidata.org/wiki/Help:Qualifiers/es#/media/File:
Statement_with_multiple_values_-_Hillary_Clinton.png
66. ● Acreditan la veracidad de las afirmaciones
○ Libros, publicaciones, artículos de periódicos
○ enlaces de sitio (importado de, mejor)
● No son necesarias si ...
○ conocimiento común
○ si el elemento referencia a una fuente de datos
verificada (identificador de VIAF)
○ el elemento lo explica (autor del libro)
Fuentes
https://www.wikidata.org/wiki/Help:Sources/es
67. ● Enlaces de elementos de Wikidata a sitio Wikimedia
○ Wikipedia
○ Wikivoyage
○ Wikisource
● Idioma
Enlaces de sitio
(sitelinks/interwiki links)
https://www.wikidata.org/wiki/Help:Sitelinks/es
69. ● Asegurarse de que no existe
○ buscar
○ elemento por título
● Si vemos a posteriori que hay elementos
repetidos:
https://www.wikidata.org/wiki/Special:MergeItems
https://www.wikidata.org/wiki/Wikidata:Interwiki_conflicts
Crear un elemento
70. ● Asegurarse de que no existe
○ buscar
○ elemento por título (ES/EU/EN, texto exacto)
● Si vemos a posteriori que hay elementos
repetidos:
https://www.wikidata.org/wiki/Special:MergeItems
https://www.wikidata.org/wiki/Wikidata:Interwiki_conflicts
Crear un elemento
https://www.wikidata.org/wiki/Special:NewItem
71. ● Encontrar un elemento
○ al azar: https://www.wikidata.org/wiki/Q17151668
○ necesitado de edición: https://tools.wmflabs.
org/wikidata-terminator/
○ http://tools.wmflabs.org/wikidata-game/
○ uno que os interese:
■ buscar
■ elemento por título
○
● Editar incluyendo nuevas afirmaciones,
fuentes, calificadores, idiomas!
Enriquecer un elemento
80. Sugerencias
Tenemos:
● Enlazar siempre con Q10313
● Instancias de
● Varias temáticas
● Sugerencias de qué propiedades incluir en
tipos de elementos
● Sugerencias de fuentes de datos que utilizar
○ inspiración
○ fuente
3 docs públicos (L/E)
https://sites.google.
84. Estadísticas de Wikipedia:
http://s23.org/wikistats/wikipedias_html.php
Estadísticas de Wikidata: https://www.wikidata.
org/wiki/Wikidata:Statistics
Krötzsch, M. (2014). Wikidata: A Free Collaborative
Knowledge Base (presentation) In: SWIB 2014.
http://swib.org/swib14/slides/kroetzsch_swib14_53.pdf
Ejemplos de aplicaciones
http://blog.wikimedia.de/tag/Wikidata/
Referencias (I)
85. Steiner, T. (2014). Bots vs. Wikipedians, Anons
vs. Logged-Ins (Redux): A Global Study of Edit
Activity on Wikipedia and Wikidata. In:
Proceedings of The International Symposium
on Open Collaboration 2014
Referencias (II)