Este documento presenta un seminario sobre sistemas inteligentes y ciencia de datos que incluye 6 partes principales: 1) datos, información y conocimiento, 2) nuevos modelos de negocio basados en información, 3) estudios de caso sobre tratamiento de información, 4) otros casos de estudio, 5) conclusión y 6) referencias. Se discuten temas como big data, open data, ciencia de datos, complejidad económica, cloud computing e inteligencia artificial aplicada a problemas empresariales.
1. Sistemas de Información Avanzados (Comercio electrónico)
Máster de estudios avanzados en dirección de empresas
Sistemas Inteligentes y la Ciencia del Dato
Retos para las empresas
Joaquín Borrego Díaz
Grupo Lógica, Computación e Ingeniería del Conocimiento PAIDI TIC-137
Departamento de Ciencias de la Computación e Inteligencia Artificial
jborrego@us.es, Twitter:jborrego
2. Preliminares
• Prospección...
Contenido
• Tecnologías relacionadas con la IA Parte III: Casos de estudio de
• Información en Internet y en sus aledaños tratamiento de la información
• Big Data
• Caso I, especial:
Interoperabilidad Semántica para la
Parte I: Datos, Información, Conocimiento empresa
• Open Data
• La ciencia del dato
Parte III (cont): Otros casos de estudio
• Procesamiento de eventos complejos
• Complejidad económica • Caso II: Minería de opiniones y
sentimientos
• Cloud Computing
Parte II: Algunos (nuevos) modelos de
• Caso III: Predicción bajo
racionalidad acotada
negocio basados en información y redes
• Nuevo modelo de negocio: big data • Caso IV: Servicios en movilidad
trading & processing. Ejemplos basados en conocimiento
• Modelos crowdsourcing. Ejemplos • Caso V: Informática urbana.
SmartCities
• Modelos disruptivos
• Capitalismo Indie • Caso VI: Content Curation
4. Preliminares
• Prospección...
Contenido
• Tecnologías relacionadas con la IA Parte III: Casos de estudio de
• Información en Internet y en sus aledaños tratamiento de la información
• Big Data
• Caso I, especial:
Interoperabilidad Semántica para la
Parte I: Datos, Información, Conocimiento empresa
• Open Data
• La ciencia del dato
Parte III (cont): Otros casos de estudio
• Procesamiento de eventos complejos
• Complejidad económica • Caso II: Minería de opiniones y
sentimientos
• Cloud Computing
Parte II: Algunos (nuevos) modelos de
• Caso III: Predicción bajo
racionalidad acotada
negocio basados en información y redes
• Nuevo modelo de negocio: big data • Caso IV: Servicios en movilidad
trading & processing. Ejemplos basados en conocimiento
• Modelos crowdsourcing. Ejemplos • Caso V: Informática urbana.
SmartCities
• Modelos disruptivos
• Capitalismo Indie • Caso VI: Content Curation
6. NO voy a aventurar
escenarios
• Lectura interesante
http://www.shell.com/global/future-energy/scenarios/
explorers-guide.html
7. Ejemplo
(escenarios a 2020,
realizados en 2002)
• As pressure on governments increases—in part because of the demands
of ageing societies—and their capacity to act diminishes, citizens
become more cynical about both mass politics and governance. Many
people feel compelled to seek alternative modes of
political expression—through participating in demonstrations
staged as media events, for example, or in various forms
of direct pressure by NGOs and other interest groups.
• Corporations are also active in the policy-making arena,
pushing their own agendas. The public sees
multinationals, especially, as having a large impact on
global policy, and these companies are often targeted as a
prime cause of global problems.
8. Vamos a hacer prospectiva
“sin predicción”
• Innovación:
• Adecuación
• Tendencias
• ¿Inteligencia Artificial?
• Productos finales
10. Una herramienta muy útil...
El ciclo “hype” de Gartner
• Lanzamiento - La primera • Rampa de
fase de un ciclo de bombo es consolidación - Aunque la
el "lanzamiento", una prensa haya dejado de cubrir
presentación del producto o la tecnología, algunas
cualquier otro evento genera empresas siguen, a través de
interés y presencia en los la "pendiente de la
medios. iluminación", experimentando
para entender los beneficios
• Pico de expectativas que puede proporcionar la
sobredimensionadas - aplicación práctica de la
En la siguiente fase, el tecnología.
impacto en los medios
genera normalmente un • Meseta de
entusiasmo y expectativas Productividad - Una
poco realistas. Es posible que tecnología llega a la "meseta
algunas experiencias pioneras de productividad", cuando sus
se lleven a cabo con éxito, beneficios están ampliamente
pero habitualmente hay más demostrados y aceptados. La
fracasos. tecnología se vuelve cada vez
más estable y evoluciona en
• Abismo de desilusión – segunda y tercera
Las tecnologías entran en el generación. La altura final de
abismo de desilusión porque la meseta varía en función de
no se cumplen las si la tecnología es
expectativas. Estas ampliamente aplicable y sólo
tecnologías dejan de estar de beneficia a un nicho de
moda y en consecuencia, por mercado.
lo general la prensa abandona
el tema. • (Extraído de Wikipedia)
11. ∫
¡!
e
em ion
tr at ?
Ex m ing
¿ r
fo cess
in o
pr
13. Tecnologías interesantes del ciclo, y
tecnologías de Ingeniería del Conocimiento
(la Inteligencia Artificial en general)
• Minería de datos (en BigData) • BigData
• Linked Data, Minería de datos
• Complex Event Processing
• Web Semántica (y agentes)
• Cloud Computing (private,
• Representación del conocimiento hybrid)
• Inteligencia colectiva • Gamification
• Sistemas multiagente, Web • Crowdsourcing
Semántica
• Procesamiento del lenguaje
• Internet of things
natural, análisis de sentimiento, • Automated content recognition
ontologías
• Application Stores
• Agentes, Web Semántica
15. • Everyday, we create 2.5 quintillion bytes
Big Data of data–so much that 90% of the data in
the world today has been created in the
last two years alone. This data comes
from everywhere:
Tratamiento y análisis de
enormes • from sensors used to gather climate
repositorios de datos information,
que resulta imposible • posts to social media sites,
tratarlos con las • digital pictures and videos posted
herramientas de online,
bases de datos y
analíticas
• transaction records of online
purchases,
convencionales
• from cell phone GPS signals
• etc.
• This data is big data.
http://www-01.ibm.com/software/data/bigdata/
16. Implicaciones
(World Economic Forum
2012)
2012
• Can human behaviour be understood, predicted and
controlled?
• The advent of “big data” – enormous datasets now being
harvested from records from websites (including social media
sites), mobile phones, GPSs and banking transactions are giving
physicists, social scientists and complex system experts
powerful new tools to understand and predict human
behaviour.
• This development likely will have profound impacts on politics,
marketing, infrastructure design and many other spheres.
17. Problemas
• Privacidad
• Datos pueden estar
distorsionados
• Potencian el aprendizaje
automático
• Extraer comportamientos
personales
• Identificación
• TECNOLOGÍA
http://www.technologyreview.com/printer_friendly_article.aspx?id=38775
18. Six Provocations for Big Data
(Boyd & Crawford, 2011)
http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1926431
• Automating Research Changes the Definition of
Knowledge
• Claims to Objectivity and Accuracy are Misleading
• Bigger Data are Not Always Better Data
• Not All Data Are Equivalent
• Just Because it is Accessible Doesn’t Make it Ethical
• Limited Access to Big Data Creates New Digital
Divides
22. Se necesita una nueva disciplina:
La ciencia del dato (Data Science)
• El buscador de
Google fue el primer
caso importante de
aplicación de esta
ciencia
Áreas implicadas:
Cloud computing
Databases and information integration
Learning, natural language processing and information
extraction
Computer vision
Information retrieval and web information access
Knowledge discovery in social and information networks
23. Ciencia del dato versus
aplicaciones sobre datos
• A data application acquires its
value from the data itself, and
creates more data as a result.
It’s not just an application with
data; it’s a data product
• Data science enables the
creation of data
products.
24. Una aplicación: Procesamiento
de eventos complejos
• ¿Qué tienen en común...
• Primavera árabe
• Crisis financiera mundial
• Crisis en Darfur
• Mercado del vino mundial
• para que puedan ser analizados y, si es
posible, ser predecidos?
26. Análisis de redes
(sistemas complejos)
/1201.3798
http:// arxiv.org/abs
http://www.ecb.int/press/pr/date/2010/html/pr100107.en.html
27. The network of global corporate control
• Concentration of power is not good or bad
in itself, says the Zurich team, but the
core's tight interconnections could be. As
the world learned in 2008, such
networks are unstable. "If one
[company] suffers distress," says
Glattfelder, "this propagates."
Red (financiera)
http://www.plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone.0025995
28. Revueltas árabes versus índice
de precios de alimentos
The Food Crises and Political Instability in North Africa and the Middle East
Marco Lagi, Karla Z. Bertrand,Yaneer Bar-Yam
http://arxiv.org/abs/1108.2455
30. Economic complexity,
Complejidad therefore, is expressed in the composition of a country’s
económica productive output and reflects the structures that
emerge to hold and combine knowledge.
• Visualización
• Redes complejas
• Diagnosis
Countries whose economic
complexity is greater than
what we would expect,
given their level of income, tend
to grow faster than those
that are “too rich” for
their current level of
economic complexity. In this
sense, economic complexity
is not just a symptom or
an expression of
prosperity:
it is a driver.
31. Tema de investigación: • Información representada
contextos formales
Aplicar el Ingeniería del
conocimiento a Complejidad • Contextualizar dentro de
países o grandes compañías
Económica
Enlaces entre
productos miden
la probabilidad de ser
co-exportados
Caminos:
composición de
capacidades
32. Complejidad económica versus control/simulación de
sistemas complejos
• Matemáticos, físicos, ingenieros o incluso músicos han desembarcado en
bancos de inversión, brókeres y hedge funds.
• Misión: desarrollar algoritmos que permitan realizar estrategias
de inversión convencionales (arbitraje, contrapartida o creación
de mercado, inversión intradía, detección de correlaciones en el precio
de los activos...), pero a mucha más velocidad gracias a los avances
tecnológicos.
• Sistemas pensados para que operen con total autonomía. No
aspiran a dar el pelotazo inmediato. Con cada movimiento, su objetivo
es ganar 0,001 euros.
• Parece una meta de rentabilidad modesta, ¿no? Multipliquen esta
cantidad por miles de operaciones por minuto, ocho horas al día, cinco
días a la semana, 52 semanas al año... Un martillo pilón con el que hacer
dinero si se acierta con el modelo.
34. Computación en la nube y la combinación de hypes
The Nexus of Forces: Social, Mobile, Cloud and
Information (Gartner 2012)
The nexus of forces describes the convergence and mutual
reinforcement of four interdependent trends: social interaction,
mobility, cloud, and information. The forces combine to
empower individuals as they interact with each other and their
information through well-designed ubiquitous technology.
http://www.gartner.com/technology/research/nexus-of-forces/
46. Datos “cerrados”
versus datos abiertos
• Transporte
• Localización de nuevos enclaves para
servicios
• Estudios de mercado
• ...
http://www.guardian.co.uk/public-leaders-network/blog/2012/mar/19/
open-data-raw-material-industrial?CMP=twt_gu
47. Open Data
• Poner a disposición pública datos de instituciones, organizaciones,
etc.
• Privacidad, protección de datos
• No descarga de bases de datos. Consulta en forma de APIs
• Construcción de Mashups
Tecnologías
para la
transparencia
• Data visualisation and navigation
• Data collection
• Connecting and engaging citizens
via social media networks
• Going mobile
• Traditional media
http://www.transparency-initiative.org/reports/global-mapping-of-technology-for-transparency-and-accountability
http://es.scribd.com/doc/61030999/Open-data-study-New-technologies
48. Públicos, privados
Transparencia
Institucional
Estandarización
de formatos
Transparencia
corporativa
51. Linked Data
• Los Datos Enlazados es la forma
que tiene la Web Semántica de
vincular los distintos datos que están BBC:
distribuidos en la Web BBC music
BBC programs
• “Linked data: datos sin ontologías” BBC WildLife Finder
• Los datos enlazan cosas arbitrarias
que se describen en RDF.
• Se vinculan a recursos de otros
sitios de la WWW
• Se calcula combinando/agregando
datos enlazados de distintos
recursos
• Se ponen a disposición de la
comunidad los resultados
• Open Linked Data
52. Linked Data Canalización débil del conocimiento
• Proponer semantizaciones
débiles en forma de
clientes para proyectos
existentes
• Linked data versus open
data
• Sistemas para
extraer conocimiento
de la empresa
Ejemplo:
Empresa farmacéutica
55. ¡!
RDFa es un conjunto
de extensiones de
XHTML propuestas
por W3C para
introducir semántica
en los documentos.
Se ha definido una
correspondencia
simple que
permite extraer
tripletes RDF
64. Negocio basado en datos
• Modelo Premium
(para empresas)
• Estudios, análisis
• Venta de datos para
analíticas,
predicciones
marketing, social
media, etc.
• ¿Tuits patrocinados?
65. Ejemplo II
• Mensajería gratuita entre smartphones
• Muerte del SMS
• Es una empresa con muy pocos gastos y un potencial de venta muy grande
• Valoración actual altísima
• ¿Modelo de negocio?
• Es propiedad de WhatsApp:
• Creación de una gran base de datos de mensajes (marca temporal). No
borrable desde el terminal
• Red social (contactos)
• Geolocalización de los mensajes (si está activado)
• Diferencia con Facebook: la comunicación por WhatsApp es ubicua y
apremiante
• Puede vender datos
• Puede contextualizar publicidad
• Ahora está en fase de crear la necesidad
• ¿Cuánto vale WhatsApp?
68. Movimientos/visibilidad:
compra de empresas en el universo Big Data
2011
http://ge.geglobalresearch.com/blog/the-birds-eye-view-of-big-data/
69. Modelo de negocio basado
en el ciclo completo
• Dispositivo
• Flujo de datos
• Modelo freemium
para el almacenamiento
• Exploración de
nuevos tipos de
explotación de la
información
70. • Ecosistema para modelos de negocio basados
en open data
http://www.deloitte.com/assets/Dcom-UnitedKingdom/Local%20Assets/Documents/Market
%20insights/Deloitte%20Analytics/uk-da-open-growth.pdf
76. Ejemplo de Kickstarter
El éxito llevó a los autores a dejar sus trabajos y
centrarse en el desarrollo del producto a través de
la constitución de una empresa, Studio Neat,
79. Capitalismo “Indie”
• Indie capitalism is local, not global, and cares about
the community and jobs and says so right up front
• Indie capitalism is socially, not transactionally,
based
• Indie capitalism is, above all, a maker system of economics
based on creating new value, not trading old
value
• Indie capitalism characteristic is a heightened
meaning embedded in materials and products
http://www.fastcodesign.com/1665567/4-reasons-why-the-future-of-capitalism-is-homegrown-
small-scale-and-independent
81. Sistemas de Información Avanzados (Comercio electrónico)
Máster de estudios avanzados en dirección de empresas
Fin del bloque I
Joaquín Borrego Díaz
Grupo Lógica, Computación e Ingeniería del Conocimiento PAIDI TIC-137
Departamento de Ciencias de la Computación e Inteligencia Artificial
jborrego@us.es, Twitter:jborrego