1ª parte de la charla que impartí en el Sistemas de Información Avanzados (Comercio electrónico)
Máster de estudios avanzados en dirección de empresas de la U. de Sevilla en Febrero de 2012
Innovación en el tratamiento de la información desde la Ingeniería del Conocimiento Parte (I)
1. Sistemas de Información Avanzados (Comercio electrónico)
Máster de estudios avanzados en dirección de empresas
Innovación en el tratamiento de la información desde la
Ingeniería del Conocimiento
Parte (I)
Joaquín Borrego Díaz
Grupo Lógica, Computación e Ingeniería del Conocimiento PAIDI TIC-137
Departamento de Ciencias de la Computación e Inteligencia Artificial
jborrego@us.es, Twitter:jborrego
2. Preliminares
• ¿Cuándo innovar? Contenido
• Información en Internet y en la
Web 2.0
Parte III: Casos de estudio de
• Big data tratamiento de la información
• Big data como evidencia de un
• Caso I: Minería de opiniones y
sistema complejo
sentimientos
• Open data y Linked data. Proyectos
• Caso II: Predicción bajo
Parte I: Modelos de negocio basados en racionalidad acotada
información
• Freenomics versus data • Caso III: Complejidad económica
• Nuevo modelo de negocio: big data
trading & processing
• Caso IV: Interoperabilidad
Semántica para la empresa
• Ejemplos
• Caso V: Informática urbana.
Parte II: Minería de conocimiento SmartCities
• Análisis Formal de Conceptos • Caso VI: Servicios en movilidad
• Servicios de etiquetado basados en conocimiento
3. Innovación
La ciencia es el pilar del
desarrollo tecnológico y de
la innovación...
...Y la ciencia se basa en la
teoría, en la investigación
• Innovación:
• Aplicación de nuevos resultados
• Adopción de nuevas tecnologías
• I+D+i
12. Flujos de
información
Web 1.0, Web 2.0 y
Semantic Web
13. • Everyday, we create 2.5 quintillion bytes of
Big Data data–so much that 90% of the data in the
world today has been created in the last
two years alone. This data comes from
everywhere:
Tratamiento y análisis de
enormes • from sensors used to gather climate
information,
repositorios de datos
que resulta imposible • posts to social media sites,
tratarlos con las • digital pictures and videos posted
online,
herramientas de
bases de datos y • transaction records of online purchases,
analíticas • from cell phone GPS signals
convencionales • etc.
• This data is big data.
http://www-01.ibm.com/software/data/bigdata/
14. Implicaciones
(World Economic Forum 2012)
• Can human behaviour be understood,
predicted and controlled?
• The advent of “big data” – enormous datasets
now being harvested from records from
websites (including social media sites), mobile
phones, GPSs and banking transactions are
giving physicists, social scientists and
complex system experts powerful new
tools to understand and predict human
behaviour.
• This development likely will have
profound impacts on politics,
marketing, infrastructure design and
many other spheres.
http://www.weforum.org/sessions/summary/human-network-dynamics
15. Problemas
• Privacidad
• Datos pueden estar
distorsionados
• Potencian el aprendizaje
automático
• Extraer comportamientos
personales
• Identificación
http://www.technologyreview.com/printer_friendly_article.aspx?id=38775
16. Six Provocations for Big Data
(Boyd & Crawford, 2011)
http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1926431
• Automating Research Changes the Definition of
Knowledge
• Claims to Objectivity and Accuracy are Misleading
• Bigger Data are Not Always Better Data
• Not All Data Are Equivalent
• Just Because it is Accessible Doesn’t Make it Ethical
• Limited Access to Big Data Creates New Digital
Divides
18. Sistemas complejos
• “...there is no universally accepted definition of a
complex system. Most researchers would describe a
system of connected agents that exhibits an
emergent global behavior not imposed by a
central controller, but resulting from the
interactions between the agents.”
• N. Boccara, Modeling Complex Systems
• Colonias de animales (hormigueros), redes sociales, ciudades,
Internet, sistemas políticos, sociedades humanas, mercados
financieros, ecosistemas, etc.
• Multidisciplinariedad en el tratamiento de la
información disponible
• EMERGENCIA
19. Niveles de organización
• In general terms, a “complex system” is any system
comprised of a great number of heterogeneous entities,
where local interactions among entities create multiple
levels of collective structure and organization.
• The specificity of complex systems, generally
underinvestigated or simply not addressed by traditional
science, resides in the emergence of non-trivial
superstructures that often dominate the
system’s behavior and cannot be easily traced
back to the properties of the constituent
entities.
http://www.assystcomplexity.eu/db/assyst/ASSYST_roadmap2009_2.pdf
20. Comportamiento racional (humano)
ante la información
• Comportamiento humano ante la falta o exceso de información
(infoxicación)
• Colectivo: Trust-based computing
• Individual: Racionalidad acotada
• Heurística de reconocimiento
• Fast & frugal methods
• Razonamiento no monótono
• Otro método: Reglas de asociación
• Reglas generales que no son 100% válidas
• Razonamiento deductivo basado confianza
• Representación y razonamiento visual
22. Open Data
• Poner a disposición pública datos de instituciones, organizaciones,
etc.
• Privacidad, protección de datos
• No descarga de bases de datos. Consulta en forma de APIs
• Construcción de Mashups
Tecnologías
para la
transparencia
• Data visualisation and navigation
• Data collection
• Connecting and engaging citizens
via social media networks
• Going mobile
• Traditional media
http://www.transparency-initiative.org/reports/global-mapping-of-technology-for-transparency-and-accountability
http://es.scribd.com/doc/61030999/Open-data-study-New-technologies
23. Públicos, privados
Transparencia
Institucional
Estandarización
de formatos
Transparencia
corporativa
25. Common Crawl
• Common Crawl is a non-profit
foundation dedicated to building and
maintaining an open crawl of the
web, thereby enabling a new wave
of innovation, education and
research.
26. Linked Data
• Los Datos Enlazados es la forma
que tiene la Web Semántica de
vincular los distintos datos que están BBC:
distribuidos en la Web BBC music
BBC programs
• “Linked data: datos sin ontologías” BBC WildLife Finder
• Los datos enlazan cosas arbitrarias
que se describen en RDF.
• Se vinculan a recursos de otros
sitios de la WWW
• Se calcula combinando/agregando
datos enlazados de distintos
recursos
• Se ponen a disposición de la
comunidad los resultados
• Open Linked Data
27. Linked Data Canalización débil del conocimiento
• Proponer semantizaciones
débiles en forma de
clientes para proyectos
existentes
• Linked data versus open
data
• Sistemas para
extraer conocimiento
de la empresa
Ejemplo:
Empresa farmacéutica
28. Ejemplos de proyectos
aprobados sobre
linked/open data
Ejemplos de potencial innovación
29. Sistemas
semánticos;
captura y
explotación de
los
conocimientos
incorporados a
contenidos web
y multimedia
31. Nuevas formas
de procesos
empresariales
cooperativos
en red y
dinámicos
Gestión inteligente
del conocimiento
en la empresa
32. Accesibilidad y utilización a lo largo del tiempo de
recursos y bienes culturales y científicos digitales con
inclusión de lo que afecta al patrimonio cultural.
33. Parte I: Modelos de negocio
basados en información
i cs
n om
ee
Fr
38. Ejemplo II
• Mensajería gratuita entre smartphones
• Muerte del SMS
• Es una empresa con muy pocos gastos y un potencial de venta muy grande
• Valoración actual altísima
• ¿Modelo de negocio?
• Es propiedad de WhatsApp:
• Creación de una gran base de datos de mensajes (marca temporal). No
borrable desde el terminal
• Red social (contactos)
• Geolocalización de los mensajes (si está activado)
• Diferencia con Facebook: la comunicación por WhatsApp es ubicua y
apremiante
• Puede vender datos
• Puede contextualizar publicidad
• Ahora está en fase de crear la necesidad
• ¿Cuánto vale WhatsApp?
43. Análisis Formal de
Conceptos
Extracción automatizada de jerarquías de conceptos a
partir de datos
44. Cuestión: Extraer automáticamente
conceptualizaciones a partir de datos
• Problema: Cómo obtener, a Fluvial Litoral Océano
partir de observaciones, una Carpa X
primera ontología (conceptos y
relaciones entre los conceptos)
Escatófagus X X
Sargo X X
• Ejemplo: Estudiar propiedades Dorada X X
de los peces carpa, escatófagus,
sargo, dorada y anguila Anguila X X X
• Contexto formal (O,A,I):
• O={c,e,s,d,a}
• Un conjunto O de objetos
• A={fluvial, litoral, océano}
• Un conjunto A de atributos
• I está representada en la tabla
(dos elementos relacionados
• Una relación I entre
marcados con X)
objetos y atributos
45. Concepto:
Intención y extensión
• Operación básica en contextos formales: derivación
• Si X conjunto de objetos, la intención de X es:
• X’={ a : oIa para todo o objeto del conjunto X}
• (los atributos comunes a todos los objetos de X)
• Si Y conjunto de atributos, la extensión de Y es:
• Y’={o : oIa para todo atributo del conjunto Y}
• (los objetos que tienen todos los atributos de Y)
• En nuestro ejemplo:
• {fluvial, océano}’={anguila}
• {carpa, sargo}’ es el conjunto vacío
• {escatófagus, sargo}’={litoral}
46. Contención entre conceptos
• Un par (X,Y) es un concepto si:
• X es un conjunto de objetos (la extensión del concepto)
• Y es un conjunto de atributos (la intensión del concepto)
• Y’=X y X’=Y
50. Aplicaciones
• Bioinformática
• Diseño de nuevos medicamentos
• Data mining
• Conceptualización de las búsquedas en la Web
• Web Semántica móvil
• Conciliación de conocimiento
• Pronóstico de apuestas deportivas
52. Implicaciones entre atributos
• Objetivo: Obtener un conjunto de relaciones entre los
objetos y/o atributos
• Utilizamos implicaciones entre atributos: Lógica de
atributos
• Una implicación entre atributos es una expresión
del tipo Y1→Y2
• donde Y1,Y2 ⊆A
• Y1→Y2 es válida en un contexto (O,A,I) si para
todo o∈O, el conjunto {o}’ respeta la implicación
53. Bases de conocimiento
• Base de conocimiento para el ejemplo:
• Un conjunto completo e • ∅→{N}
irredundante de implicaciones se
denomina Base • {N,A}→{M}
• {N,P}→{M}}
• Se puede obtener una base
para un contexto dado
54. Extensiones del Análisis
Formal de Conceptos
• Dependencias funcionales entre
atributos
• Representaciones gráficas de los
retículos
• Comparaciones entre contextos
• Contextos multivaluados
• Retículos de tipo iceberg: análisis
de conceptos con soporte
suficientemente grande: conceptos
(X,Y) con soporte
• |X|/|M|≥m para cierto m∈[0,1]
55. Especialización del AFC a etiquetados
• Opciones interesantes: Delicious, flickr, etc.
• Objetos: lo que etiquetamos
• Atributos: etiquetas
• Historial de búsqueda en un sitio
• Uso de recursos de la Web profunda
• Nuevos navegadores conceptuales
56. Aplicaciones en servicios de etiquetado
• Extracción de ontologías (retículos de conceptos) de
sistemas de etiquetación colaborativa
• Aplicación intensiva de las ontologías sobre tags para tratar
el conocimiento etiquetado con el AFC.
• Extensión de la lógica de atributos (implicaciones) a
lógicas más ricas.
• Navegadores conceptuales
• Conciliación del conocimiento implícito en etiquetados
• Razonamiento automático en la navegación conceptual
• Inteligencia Artificial para potenciar el razonamiento.
59. Experimentos
de conciliación
automática en
Delicious
Poseer
Atributos comunes es
mejor que
objetos (urls) comunes
60. Sistemas de Información Avanzados (Comercio electrónico)
Máster de estudios avanzados en dirección de empresas
Innovación en el tratamiento de la información desde la
Ingeniería del Conocimiento
Fin de la parte I
Joaquín Borrego Díaz
Grupo Lógica, Computación e Ingeniería del Conocimiento PAIDI TIC-137
Departamento de Ciencias de la Computación e Inteligencia Artificial
jborrego@us.es, Twitter:jborrego