SlideShare uma empresa Scribd logo
1 de 2
Baixar para ler offline
Universidad Nacional Abierta y a Distancia UNAD
1
INFORME DE LABORATORIO ARQUITECTURA DE COMPUTADORES
(PRACTICA No. 4)
Andrés González Téllez
Cód.: 1022929026 Tel: 3203021447 E-Mail: agonzalezte@unadvirtual.edu.co
Tutor: Wilson Pérez Correa
Abstract
Analyze the operation of Big Data its history and how it
has been growing since in 2008 hovered peta bytes and
every day grows enormously since all electronic devices
are storing data is also known as macro data, massive
data, data intelligence or data On a large scale and as all
information has been changing from the physical
equipment of each company to move to the cloud to
manage immense amounts of information.
Resumen
Realizar un análisis sobre el Big Data y su
funcionamiento como también en que ámbito se utiliza
el big data y como es su almacenamiento
Palabras Clave: macro datos, peta bytes, zettabits,
datos relacionales, datos no relacionales
1. Introducción
Big data: (Tomado de Wikipedia) disciplina dedicada a
los datos masivos se enmarca en el sector de las
tecnologías de la información y la comunicación. Esta
disciplina se ocupa de todas las actividades relacionadas
con los sistemas que manipulan grandes conjuntos de
datos. Las dificultades más habituales vinculadas a la
gestión de estas cantidades de datos se centran en la
recolección y el almacenamiento, 3 búsquedas,
compartición, análisis, 4 y visualización. La tendencia a
manipular enormes cantidades de datos se debe a la
necesidad en muchos casos de incluir dicha información
para la creación de informes estadísticos y modelos
predictivos utilizados en diversas materias, como los
análisis de negocio, publicitarios, los datos de
enfermedades infecciosas, el espionaje y seguimiento a
la población o la lucha contra el crimen organizado.
2. Herramientas para Big data
Hadoop: sistema de código abierto que se utiliza para
almacenar, procesar y analizar grandes volúmenes de datos.
Se puede descargar del siguiente link:
http://hadoop.apache.org/releases.html
Fig.1. Logo Hadoop
Hadoop
Difiere del modelo clásico relacional de bases de datos
ya que las consultas no van en tablas y se utilizan
principalmente en las redes sociales, se clasifican según
su forma de almacenar los datos, y comprenden
categorías como clave-valor.
Hadoop es una gran plataforma, especialmente para
combinar los datos de ambos legados, viejos y nuevos
datos no estructurados. 2) Una gran cantidad de
proveedores están entrando en el juego de ofrecer
soporte y servicios en torno a Hadoop, por lo que es más
aceptable para las empresas
Algunas de las empresas más conocidas que utilizan
Hadoop son IBM, Intel, Microsoft
Fig.2. No SQL
Apache Cassandra:
Base de datos nosql de distribución libre bajo la
plataforma java y permite la gestión de grandes
volúmenes de datos en forma distribuida y se basa
principalmente en la escalabilidad lineal y la
disponibilidad inmediata su estructura está conformada
por una serie de nodos iguales que se comunican por
medio de P2P.
Se puede descargar con del siguiente link:
http://cassandra.apache.org/download/
Algunas de las empresas más conocidas que utilizan
Cassandra son Netflix, Spotify y Twitter.
Fig.3. Logo Apache Cassandra
Mongodb
Crear nuevos tipos de aplicaciones por medio de bases
de datos no relacionales, mejorar la experiencia del
Universidad Nacional Abierta y a Distancia UNAD
2
cliente, acelerar el tiempo de comercialización y reducir
costes al ser rápido y confiable.
Ejemplo: la empresa Bosch está poniendo a prueba una
aplicación que es capaz de capturar datos del vehículo
como el sistema de frenado, la dirección asistida, los
limpiaparabrisas, etc. Con todos esos datos capturados,
se pueden hacer diagnósticos de necesidad de
mantenimiento preventivo
Se puede descargar con del siguiente link:
https://www.mongodb.com/download-
center?jmp=nav#community
Fig.3. Logo Mongodb
2.1. Tipos de big data
2.2.1. Datos Estructurados: se determinan por su
longitud y por su formato como por ejemplo números,
cadenas, caracteres y son almacenados en tablas que se
clasifican en datos relacionales o las hojas de cálculo.
2.2.2. Datos no estructurados: estos datos no poseen un
formato y no se almacenan en tablas o crear relaciones
entre los más conocidos son documentos en pdf,
documentos, correos.
2.2.3. Datos Semiestructurados: se basa en una
estructura regular y no tiene un orden específico pueden
tener o no relaciones entre ellos y acaban siendo
aceptados como por ejemplo un HTML o un XML
3. Conclusiones
Se comprendió los conceptos básicos del big data y
como dar los primeros pasos para su utilización.
Se Identificaron los diferentes tipos de datos y
como ha ido evolucionando el almacenamiento de datos
hasta el día de hoy.
Se verificaron programas o software para iniciar
con la gestión de las bases de datos o macro datos de
una capacidad inmensa
4. Referencias
[1] Administre cantidades masivas de datos, rápido, sin perder el
sueño. (Dakota Del Norte.). Obtenido el 27 de Abril de
2017, de http://cassandra.apache.org/
[2] Big Data. (2017, 16 de abril). Obtenido el 27 de abril de
2017, de https://es.wikipedia.org/wiki/Big_dat [3]
Gutiérrez (2015). Circuito paralelo [Video]. Recuperado de
http://hdl.handle.net/10596/6924.
[3] Banker, K. (2011). MongoDB in action. Manning
Publications Co...
[4] Manyika, J., Chui, M., Brown, B., Bughin, J., Dobbs, R.,
Roxburgh, C., & Byers, A. H. (2011). Big data: The next
frontier for innovation, competition, and productivity.

Mais conteúdo relacionado

Mais procurados

Qué es una red informática pedrp varela
Qué es una red informática pedrp varelaQué es una red informática pedrp varela
Qué es una red informática pedrp varela
JosueEscalona94
 
Base de datos 5º (2)
Base de datos 5º (2)Base de datos 5º (2)
Base de datos 5º (2)
eleanavaleria
 
Que es una base de datos power 2
Que es una base de datos power 2Que es una base de datos power 2
Que es una base de datos power 2
lulu-fer
 

Mais procurados (16)

Manejo De Datos
Manejo De DatosManejo De Datos
Manejo De Datos
 
Qué es una red informática pedrp varela
Qué es una red informática pedrp varelaQué es una red informática pedrp varela
Qué es una red informática pedrp varela
 
Bases de Datos Gabriel
Bases de Datos GabrielBases de Datos Gabriel
Bases de Datos Gabriel
 
Libro Base de Datos
Libro Base de DatosLibro Base de Datos
Libro Base de Datos
 
Base de datos
Base de datosBase de datos
Base de datos
 
Uso de las Bases De Datos
Uso de las Bases De DatosUso de las Bases De Datos
Uso de las Bases De Datos
 
Base de datos 5º (2)
Base de datos 5º (2)Base de datos 5º (2)
Base de datos 5º (2)
 
Presentación
PresentaciónPresentación
Presentación
 
Fundamentos de BD
Fundamentos de BDFundamentos de BD
Fundamentos de BD
 
República bolivariana de venezuela
República bolivariana de venezuelaRepública bolivariana de venezuela
República bolivariana de venezuela
 
Que es una base de datos power 2
Que es una base de datos power 2Que es una base de datos power 2
Que es una base de datos power 2
 
Resumen - Introducción a la base de datos
Resumen - Introducción a la base de datos Resumen - Introducción a la base de datos
Resumen - Introducción a la base de datos
 
Tipos de base de datos
Tipos de base de datosTipos de base de datos
Tipos de base de datos
 
Plataforma
PlataformaPlataforma
Plataforma
 
Plataforma
PlataformaPlataforma
Plataforma
 
vicrael pineda
vicrael pinedavicrael pineda
vicrael pineda
 

Semelhante a Laboratorio 3 big data

La importancia de la base de datos
La importancia de la base de datosLa importancia de la base de datos
La importancia de la base de datos
Raul Martinez
 
Exposicion big data
Exposicion big dataExposicion big data
Exposicion big data
mateo luquez
 

Semelhante a Laboratorio 3 big data (20)

Introduccion big data
Introduccion  big dataIntroduccion  big data
Introduccion big data
 
Big data y hadoop
Big data y hadoopBig data y hadoop
Big data y hadoop
 
big data
big  databig  data
big data
 
Presentación big data
Presentación big dataPresentación big data
Presentación big data
 
Big Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patronesBig Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patrones
 
Glosario base de datos
Glosario base de datosGlosario base de datos
Glosario base de datos
 
Laboratorio 3 formato ieee "Tecnologias de Big Data"
Laboratorio 3 formato ieee "Tecnologias de Big Data"Laboratorio 3 formato ieee "Tecnologias de Big Data"
Laboratorio 3 formato ieee "Tecnologias de Big Data"
 
La importancia de la base de datos
La importancia de la base de datosLa importancia de la base de datos
La importancia de la base de datos
 
Qué es big data
Qué es big dataQué es big data
Qué es big data
 
TIPOS DE BDD Y SGBD
TIPOS DE BDD Y SGBDTIPOS DE BDD Y SGBD
TIPOS DE BDD Y SGBD
 
Resumen base de datos samuel ramirez
Resumen base de datos samuel ramirezResumen base de datos samuel ramirez
Resumen base de datos samuel ramirez
 
Tics 1
Tics 1Tics 1
Tics 1
 
Introducción a la informática
Introducción a la informáticaIntroducción a la informática
Introducción a la informática
 
Sobware 2.1
Sobware 2.1Sobware 2.1
Sobware 2.1
 
Exposicion big data
Exposicion big dataExposicion big data
Exposicion big data
 
Sistemasinformacion
SistemasinformacionSistemasinformacion
Sistemasinformacion
 
Base de datos presentacion
Base de datos presentacionBase de datos presentacion
Base de datos presentacion
 
introduccion-al-analisis-de-datos--------
introduccion-al-analisis-de-datos--------introduccion-al-analisis-de-datos--------
introduccion-al-analisis-de-datos--------
 
Base de datos
Base de datosBase de datos
Base de datos
 
Base de datos
Base de datosBase de datos
Base de datos
 

Último

metodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un pacientemetodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un paciente
MedicinaInternaresid1
 
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIALINFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
MANUELVILELA7
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
IrapuatoCmovamos
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
BESTTech1
 

Último (20)

CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxCUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
 
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombiadecreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
 
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docxAMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
 
El Manierismo. El Manierismo
El Manierismo.              El ManierismoEl Manierismo.              El Manierismo
El Manierismo. El Manierismo
 
diseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptxdiseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptx
 
metodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un pacientemetodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un paciente
 
La Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdfLa Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdf
 
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptxP.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
 
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdfPorcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
 
6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx
 
aine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificaciónaine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificación
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdf
 
procedimiento paran la planificación en los centros educativos tipo v(multig...
procedimiento  paran la planificación en los centros educativos tipo v(multig...procedimiento  paran la planificación en los centros educativos tipo v(multig...
procedimiento paran la planificación en los centros educativos tipo v(multig...
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdf
 
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILASistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
 
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIALINFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
 
biometria hematica y hemostasia y preanalitica.pptx
biometria hematica y hemostasia y preanalitica.pptxbiometria hematica y hemostasia y preanalitica.pptx
biometria hematica y hemostasia y preanalitica.pptx
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdf
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
 

Laboratorio 3 big data

  • 1. Universidad Nacional Abierta y a Distancia UNAD 1 INFORME DE LABORATORIO ARQUITECTURA DE COMPUTADORES (PRACTICA No. 4) Andrés González Téllez Cód.: 1022929026 Tel: 3203021447 E-Mail: agonzalezte@unadvirtual.edu.co Tutor: Wilson Pérez Correa Abstract Analyze the operation of Big Data its history and how it has been growing since in 2008 hovered peta bytes and every day grows enormously since all electronic devices are storing data is also known as macro data, massive data, data intelligence or data On a large scale and as all information has been changing from the physical equipment of each company to move to the cloud to manage immense amounts of information. Resumen Realizar un análisis sobre el Big Data y su funcionamiento como también en que ámbito se utiliza el big data y como es su almacenamiento Palabras Clave: macro datos, peta bytes, zettabits, datos relacionales, datos no relacionales 1. Introducción Big data: (Tomado de Wikipedia) disciplina dedicada a los datos masivos se enmarca en el sector de las tecnologías de la información y la comunicación. Esta disciplina se ocupa de todas las actividades relacionadas con los sistemas que manipulan grandes conjuntos de datos. Las dificultades más habituales vinculadas a la gestión de estas cantidades de datos se centran en la recolección y el almacenamiento, 3 búsquedas, compartición, análisis, 4 y visualización. La tendencia a manipular enormes cantidades de datos se debe a la necesidad en muchos casos de incluir dicha información para la creación de informes estadísticos y modelos predictivos utilizados en diversas materias, como los análisis de negocio, publicitarios, los datos de enfermedades infecciosas, el espionaje y seguimiento a la población o la lucha contra el crimen organizado. 2. Herramientas para Big data Hadoop: sistema de código abierto que se utiliza para almacenar, procesar y analizar grandes volúmenes de datos. Se puede descargar del siguiente link: http://hadoop.apache.org/releases.html Fig.1. Logo Hadoop Hadoop Difiere del modelo clásico relacional de bases de datos ya que las consultas no van en tablas y se utilizan principalmente en las redes sociales, se clasifican según su forma de almacenar los datos, y comprenden categorías como clave-valor. Hadoop es una gran plataforma, especialmente para combinar los datos de ambos legados, viejos y nuevos datos no estructurados. 2) Una gran cantidad de proveedores están entrando en el juego de ofrecer soporte y servicios en torno a Hadoop, por lo que es más aceptable para las empresas Algunas de las empresas más conocidas que utilizan Hadoop son IBM, Intel, Microsoft Fig.2. No SQL Apache Cassandra: Base de datos nosql de distribución libre bajo la plataforma java y permite la gestión de grandes volúmenes de datos en forma distribuida y se basa principalmente en la escalabilidad lineal y la disponibilidad inmediata su estructura está conformada por una serie de nodos iguales que se comunican por medio de P2P. Se puede descargar con del siguiente link: http://cassandra.apache.org/download/ Algunas de las empresas más conocidas que utilizan Cassandra son Netflix, Spotify y Twitter. Fig.3. Logo Apache Cassandra Mongodb Crear nuevos tipos de aplicaciones por medio de bases de datos no relacionales, mejorar la experiencia del
  • 2. Universidad Nacional Abierta y a Distancia UNAD 2 cliente, acelerar el tiempo de comercialización y reducir costes al ser rápido y confiable. Ejemplo: la empresa Bosch está poniendo a prueba una aplicación que es capaz de capturar datos del vehículo como el sistema de frenado, la dirección asistida, los limpiaparabrisas, etc. Con todos esos datos capturados, se pueden hacer diagnósticos de necesidad de mantenimiento preventivo Se puede descargar con del siguiente link: https://www.mongodb.com/download- center?jmp=nav#community Fig.3. Logo Mongodb 2.1. Tipos de big data 2.2.1. Datos Estructurados: se determinan por su longitud y por su formato como por ejemplo números, cadenas, caracteres y son almacenados en tablas que se clasifican en datos relacionales o las hojas de cálculo. 2.2.2. Datos no estructurados: estos datos no poseen un formato y no se almacenan en tablas o crear relaciones entre los más conocidos son documentos en pdf, documentos, correos. 2.2.3. Datos Semiestructurados: se basa en una estructura regular y no tiene un orden específico pueden tener o no relaciones entre ellos y acaban siendo aceptados como por ejemplo un HTML o un XML 3. Conclusiones Se comprendió los conceptos básicos del big data y como dar los primeros pasos para su utilización. Se Identificaron los diferentes tipos de datos y como ha ido evolucionando el almacenamiento de datos hasta el día de hoy. Se verificaron programas o software para iniciar con la gestión de las bases de datos o macro datos de una capacidad inmensa 4. Referencias [1] Administre cantidades masivas de datos, rápido, sin perder el sueño. (Dakota Del Norte.). Obtenido el 27 de Abril de 2017, de http://cassandra.apache.org/ [2] Big Data. (2017, 16 de abril). Obtenido el 27 de abril de 2017, de https://es.wikipedia.org/wiki/Big_dat [3] Gutiérrez (2015). Circuito paralelo [Video]. Recuperado de http://hdl.handle.net/10596/6924. [3] Banker, K. (2011). MongoDB in action. Manning Publications Co... [4] Manyika, J., Chui, M., Brown, B., Bughin, J., Dobbs, R., Roxburgh, C., & Byers, A. H. (2011). Big data: The next frontier for innovation, competition, and productivity.