¿Que es Big Data? / What is Big Data?


BigData
Big Data

Seguramente al menos una vez a la semana escucha hablar de Big Data, pero no logra entender que es, porque no lo explican, solo lo nombran y ya. He recopilado de la forma más sencilla posible lo que explican algunas páginas web y este es el resultado:

Big Data son datos de compleja manipulación debido a su inconsistencia y/o combinaciones impredecibles. Pueden o no ser de gran tamaño, es decir una base de datos gigante no necesariamente es Big Data y una base de datos pequeña pero muy compleja puede catalogarse como Big Data.

Ejemplo de datos pequeños considerados Big Data, un avión puede llegar a tener 100mil sensores que se activan durante el vuelo, cada uno de ellos genera información específica y diferente entre sí, las combinaciones de datos generada por estos sensores es increíblemente compleja y varían por la tolerancia de error y características de cada sensor. El total de datos generados por una hora de vuelo no sería mayor a 3Gigas por cada hora de vuelo. Esto es muy pequeño.

Ejemplo de datos grandes considerados Big Data, El gran colisionador de hadrones (Large Hadron Collider, LHC) genera unos 20 petabytes de datos útiles al año, datos complejos de manejar.

De cuanto estamos hablando? 1 MB = 1024KB, 1 Giga = 1024 MB (4Giga=1 DVD), 1 TB = 1024 Gigas (1 TB=1 disco duro grande) , 1 Petabyte= 1024 TB, 1 Exabyte= 1024 Petabyte. Entonces 20 petabytes = 20,480 TB = 20,971,520 Gigas = 21,474,836,480 MB serían 20,480 discos duros de 1TB

Ejemplo de datos grandes que no son Big Data, Google procesa más o menos 20 petabytes de datos cada día. Pero estos datos son bien estructurados, Google ha podido organizarlos de forma que pueden accesar a ellos de una forma extremadamente rápida, debido a esto no se puede considerar como Big Data.

Resumen, Big Data son almacenes de datos que son complejos para interpretar por su poca o ninguna estructuración y además pueden venir de múltiples fuentes no relacionadas inicialmente pero que al final si deben estarlo.

Actualización 2014-05-08, un ejemplo clásico de Big Data circunstancial: Una empresa de al menos unos 10 años de antigüedad tiene un software contable AAA, pero como distribuyen productos, ese software no le sirve para el control que necesitan, así que compran o hacen internamente un software BBB que no se relaciona en nada con el anterior, luego se crece la empresa y la nómina que la llevaban manualmente deciden “sistematizarla” entonces compran o realizan internamente un software CCC, luego la empresa tiene múltiples departamentos que se crecen y se convierten en pequeñas empresas dentro de la empresa y realizan nuevas actividades que deben ser controladas, entonces “tercerizan” la “sistematización” de sus transacciones y cada día personal ajeno a la empresa guarda su información en un software DDD fuera de la compañía. Un buen día el gerente quiere saber como va su empresa y le traen mil hojas de todos los diferentes sofware que se manejan en la compañía, él no se va a poner a revisar todo eso, sino que encarga a su segundo al mando que le haga un resumen consolidado de toda esa información, las diferentes actividades que esta persona hace para consolidar todos esos datos de diferentes software para poderle mostrar una información clara al gerente es lo que dá el surgimiento a la interpretación de Big Data, que más Big Data puede ser tener que entender todas esas fuentes de información no relacionadas entre sí directamente pero que indirectamente forman un todo.

Los datos proporcionados por el cuerpo humano es Big Data.

*************English

Summary, Big Data are data stores that are complex to interpret for their little or no structure and it can come from multiple sources unrelated initially but ultimately they need to be.

Google handles 20 Petabytes daily but well structured data, so this isn’t Big Data.

Large Hadron Collider LHC handles 20 Petabytes / year, but these data are so complex to handle that becomes Big Data.

Example of small data considered Big Data, a plane can have 100 thousand sensors that are activated during the flight, each generates specific and different information to each other, combinations of data generated by these sensors is incredibly complex and vary by error tolerance and characteristics of each sensor. The amount of data generated by an hour flight would not be greater than 3Gigas for every hour of flight. This is very small data.

Updated 05/08/2014 , a classic example of circumstantial Big Data: A company of at least 10 years old has the AAA accounting software, but they are distributing products, the software does not serve for the control they need, so they buy or create internally new software called BBB that is not related at all with the previous one, then the company decided to change the manual payroll process for an improved “systematized system” then they buy or create internally the software called CCC, then the company has multiple departments that are growing and become small business within the company and perform new activities to be controlled, then they hire “outsourcing companies” that “systematized” the activities of their staff and every day transactions keeping their information in software called DDD outside the company. One day the manager wants to know how is doing the company and all the departments bring thousand of sheets from all the different software that are being used in the company, he is not going to get to review all of that, but instructs his second in command that makes him a consolidated summary of all this data, the different activities which that person makes to consolidate all the data from different software so that he can show the manager clear information is what gives rise to the interpretation of Big data, Big data is all these sources of information unrelated directly but indirectly form a whole.

Data provided by the human body is Big Data.

Fuentes: http://mike2.openmethodology.org/wiki/Big_Data_Definitionhttp://es.wikipedia.org/wiki/Big_datahttp://es.wikipedia.org/wiki/Petabyte

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s