Home Blog/ Transformación digital/
Transformación digital

Conviértete en científico de datos y aprende qué es la ciencia de datos desde lo más básico

Ronald Cotaquispe - 16 Mar 21

Articulo

7 min.

El cient√≠fico de datos es un profesional imprescindible en las empresas hoy en d√≠a. Tal es as√≠ que, literalmente, estas no pueden hacer nada sin √©l. ¬ŅQuieres ser as√≠ de importante en tu trabajo? Pues en este blog post te diremos c√≥mo lograrlo.

Te vamos a explicar qu√© es la ciencia de datos y te daremos algunos ejemplos concretos, pues si bien la definici√≥n de esta disciplina no es complicada, ponerla en pr√°ctica puede significar un reto may√ļsculo.

Al terminar este artículo, sabrás qué necesitas para dedicarte a la ciencia de datos y estarás listo para iniciar tu rumbo en esta carrera. No te perderás ni un solo dato importante, comenzando con los que hemos ordenado para ti en nuestro índice.

√ćndice  

  1. ¬ŅQu√© es la ciencia de datos?
  2. ¬ŅQu√© es la data?
  3. La ciencia de datos y el Big Data
  4. Conceptos clave de la ciencia de datos
  5. 5 habilidades de todo científico de datos

¬ŅQu√© es la ciencia de datos?

Para entender a qu√© se dedica un cient√≠fico de datos, la primera fuente que podemos consultar es Wikipedia, que se refiere a esta profesi√≥n como ‚Äúun campo interdisciplinario que utiliza m√©todos, procesos, algoritmos y sistemas cient√≠ficos para extraer conocimiento e informaci√≥n‚ÄĚ, la cual despu√©s es interpretada y usada para tomar decisiones.

¬ŅTe parece una definici√≥n muy complicada? En nuestro art√≠culo anterior sobre qu√© es la ciencia de datos ahondamos m√°s en este punto y lo sintetizamos en una frase muy sencilla: de lo que se trata es de convertir la informaci√≥n en conocimiento √ļtil.

Pongamos un ejemplo práctico: imagina que acabas de abrir tu tienda online de regalos para parejas. Luego de llevar el curso online de Domina Google Analytics y la Analítica Digital, puedes aplicar los principios de la ciencia de datos para recabar información sobre el perfil de las personas que entran al sitio web, cuántos realizan una compra, en qué momento lo hacen, etc.

Luego, llegas a la conclusi√≥n de que tus compradores m√°s frecuentes son hombres entre 25 a 45 a√Īos, quienes mayormente piden ramos de flores y lo hacen a fin de mes. T√ļ, como el buen cient√≠fico de datos que aspiras a ser, puedes idear promociones especiales para esas fechas. O quiz√°s ese no es el p√ļblico que hab√≠as ideado al principio, as√≠ que usas nuestra plantilla de plan de marketing digital para reformular toda tu estrategia.

Entonces, ya sabes en principio qu√© es la ciencia de datos. Pero ¬Ņes simplemente ver n√ļmeros y estad√≠sticas, y actuar en base a ellas? Pues no, nada m√°s lejos de la verdad. Y es que la informaci√≥n no siempre te va a llegar de forma tan clara y acorde a tu negocio. 

No por nada existe toda una carrera de Ingenier√≠a en Ciencias de Datos y Matem√°ticas, que abarca m√ļltiples conocimientos. Sin embargo, todos parten de un punto esencial: la data, que es lo que vamos a ver en la siguiente secci√≥n.

científico de datosFuente: Unsplash

¬ŅQu√© es la data?

Todo cient√≠fico de datos entiende que la data, como se√Īala Wikipedia, ‚Äúes una representaci√≥n simb√≥lica (num√©rica, alfab√©tica, algor√≠tmica, espacial, etc.) de un atributo o variable‚ÄĚ. En otras palabras, es un valor o referente que se le otorga a un hecho emp√≠rico, suceso o entidad.

Si te cuesta entender qu√© es la data, no te preocupes, te lo vamos a poner f√°cil. Imagina que tienes un restaurante y un grupo importante de comensales siempre pide hamburguesas, otro siempre pregunta si hay una opci√≥n vegana en el men√ļ y tu local cada vez est√° menos lleno y hay m√°s pedidos por delivery.    

Todo eso que acabas de ver son hechos empíricos; para convertirlos en datos científicos debes registrarlos y atribuirles una variable, que te permitirá medir la magnitud de dicho fenómeno. Tal como su propio nombre lo indica, la variable es algo que siempre varía.

Sobre el caso anterior, una variable sería la cantidad de personas que pide delivery, que en un universo de 100 clientes pasó de 20 a 40. Como científico de datos, esa es la información que procesas para dar una recomendación, por ejemplo, atender este cambio en la demanda con una app propia del restaurante, una que podrías desarrollar con el curso online de Crea aplicaciones en Android con Java.

En nuestro art√≠culo sobre la interpretaci√≥n de datos y su importancia para tu negocio, ya te hab√≠amos hablado sobre la variable y precisamos que esta puede ser de dos tipos: cuantitativa o cualitativa. Es importante que conozcas ambos si piensas dedicarte a la ciencia de datos.  

Variable cuantitativa

Un científico de datos sabe que las variables cuantitativas son aquellas que otorgan un valor numérico. Al respecto, dos buenos ejemplos que da la Enciclopedia Económica son la altura y peso, que son dos realidades a las que nos podemos referir con cifras que son universalmente entendibles y aceptadas.

El mismo portal se√Īala que las variables cuantitativas pueden ser discretas o continuas. En el primer caso, hablamos de cifras que se encuentran separadas en escalas y, por tanto, no admiten valores entre ellas. Por tanto, son datos cient√≠ficos que se expresan en n√ļmeros enteros. Por ejemplo, si quieres saber cu√°ntos hijos tiene una persona, pueden ser 2 o 3, pero nunca un 1 y medio.  

Por su parte, las variables cuantitativas continuas sí admiten valores en medio de dos exactos. Un ejemplo de ello sería el dinero, pues sí admite decimales (0.50, 25.45, 654.56, etc.). De hecho, un científico de datos seguramente va a trabajar con cifras relacionadas a montos.

Quienes entienden qu√© es la data saben tambi√©n que las variables cuantitativas pueden representarse en diagramas de barras, donde a puede apreciarse el valor num√©rico de cada cosa que queramos medir, por ejemplo, cu√°ntas √≥rdenes hubo de cada platillo del men√ļ. 

Por otro lado, tambi√©n existen los diagramas integrales y diagramas diferenciales, donde se observa la frecuencia relativa de cada variable. Aqu√≠, un cient√≠fico de datos observar√≠a el n√ļmero de pedidos por delivery de cada mes y se percatar√≠a de una curva ascendente. Eso ya te lo hab√≠amos explicado al tocar la importancia de usar gr√°ficos estad√≠sticos.  

Data ScienceFuente: Kanger

Variable cualitativa

En la ciencia de datos, la variable cualitativa expresa una caracter√≠stica, atributo, cualidad o categor√≠a no n√ļmerica. Un buen ejemplo, otra vez dado por Enciclopedia Econ√≥mica, es el sexo, que puede ser categorizado como masculino o femenino, pero no con una cifra.

Hay tres tipos de variables cualitativas, empezando por las nominales, que son matemáticamente las menos precisas para el científico de datos. Un ejemplo de esto serían los colores, que pueden ser rojo, blanco, amarillo, azul, etc.

Luego, est√°n las ordinarias, que son datos cient√≠ficos que s√≠ contemplan un orden, como cuando se habla del nivel socioecon√≥mico de las personas: alto, medio o bajo. Y, por √ļltimo, est√°n las binarias, que son las variables cualitativas que solo admiten dos valores, como en aquellas encuestas que te piden responder s√≠ o no, o verdadero o falso.

¬ŅTienes problemas para calcular los intereses ganados? Hazlo f√°cil con nuestra plantilla de Excel

¬ŅTienes problemas para calcular los intereses ganados? Hazlo f√°cil con nuestra plantilla de Excel

La ciencia de datos y el Big Data

Ser un cient√≠fico de datos se ha puesto de moda, pero eso no significa que se trate de un fen√≥meno reciente. Por el contrario, seg√ļn Wikipedia, tiene su origen en 1962, cuando John W. Tukey public√≥ su art√≠culo The Future of Data Analysis en la revista Anales de estad√≠stica matem√°tica.

En ese momento, por primera vez se habla de una ‚Äúciencia de datos‚ÄĚ‚Äč, pero no fue sino hasta el 2001, con la publicaci√≥n de un ensayo de William S. Cleveland, que se le reconoce una disciplina independiente de otras, entre otras cosas, por el avance de la computaci√≥n. 

Con ella, fuimos capaces de almacenar vol√ļmenes de informaci√≥n como nunca antes en la historia, tanto que fue necesario acu√Īar una nueva expresi√≥n para referirse a este fen√≥meno. Fue as√≠ como naci√≥ ‚ÄúBig Data‚ÄĚ (o macrodatos, en espa√Īol), que va m√°s all√° de lo que es la data com√ļn y corriente. 

Aunque hay mucha bibliografía al respecto, que incluye nuestro artículo sobre qué es Big Data Analytics y el curso online de Big Data aplicada a los negocios, a este concepto se le suele confundir con el de ciencia de datos. Pero, si bien ambos van de la mano, no son exactamente lo mismo.

Como ya dijimos anteriormente, Big Data se refiere a conjuntos de datos tan grandes que, para su correcto almacenamiento, gestión, procesamiento y análisis, hacen falta softwares especializados. Mientras, el Data Science consiste en transformar todo eso en información de valor para las empresas.

Data Science and Business Intelligence | Grazitti Interactive

Fuente: Grazitti Interactive

Conceptos clave de la ciencia de datos

Para ser científico de datos, deberás aprender muchos conceptos procedentes de una gran variedad de disciplinas, pero por el momento es importante que te queden en claro tres, los cuales son los pilares de tu futuro trabajo.

Data Mining

Seg√ļn la Escuela de Negocios de la Innovaci√≥n y los Emprendedores (IEBS) de M√©xico, este es un conjunto de t√©cnicas y tecnolog√≠as que permiten recolectar y almacenar grandes bases de datos cient√≠ficos de manera autom√°tica o semiautom√°tica.

Despu√©s, entre todo ese c√ļmulo de informaci√≥n, el cient√≠fico de datos busca patrones repetitivos que expliquen alg√ļn comportamiento que considere interesante para el negocio, para lo cual se utilizan algoritmos matem√°ticos. El resultado de esto son estrategias m√°s efectivas.

Deep Learning

Analytics Software & Solution se√Īala que esta es una rama de la inteligencia artificial que se basa en la idea de que los sistemas pueden aprender de los datos cient√≠ficos, identificar patrones y tomar decisiones con una m√≠nima intervenci√≥n humana.

En ese sentido, el Deep Learning (o aprendizaje autom√°tico) es un m√©todo de an√°lisis automatizado, lo que no significa que los sistemas inform√°ticos hagan todo el trabajo en lugar del cient√≠fico de datos. M√°s bien, se trata de ‚Äėeducar‚Äô a la tecnolog√≠a para que corrija errores por s√≠ sola.

Inteligencia artificial 

La p√°gina del M√°ster en Data Science de la Universidad de Alcal√° reconoce la importancia de esta tecnolog√≠a al ser capaz de procesar cantidades masivas de datos que ser√≠an imposibles para un ser humano. 

Por su parte, en el 2017, la firma global de investigaci√≥n Gartner hab√≠a pronosticado que en el 2020 m√°s del 40 % de las tareas del cient√≠fico de datos iba a ser automatizado, es decir, realizado por una inteligencia artificial. Raz√≥n m√°s que suficiente para que seas un experto en su uso y desarrollo.   

¬ŅNo sabes c√≥mo administrar tus ventas diarias? Te damos tres formatos de Excel que te ayudar√°n

¬ŅNo sabes c√≥mo administrar tus ventas diarias? Te damos tres formatos de Excel que te ayudar√°n

5 habilidades de todo científico de datos

Ya sabes de sobra qu√© es la ciencia de datos, y si ya est√°s pensando en adentrarte en este campo, toma nota de los conocimientos y las habilidades que te har√°n falta. Considera cu√°ntos de ellos ya tienes y cu√°ntos te faltan adquirir a√ļn.

Matem√°ticas

Seg√ļn Keep Coding, el cient√≠fico de datos no tiene que ser un matem√°tico puro, pero s√≠ debe entender los fundamentos de ramas como el √°lgebra lineal, el c√°lculo, los algoritmos y la estad√≠stica, que puedes entender un poco m√°s con nuestro art√≠culo sobre qu√© es el an√°lisis estad√≠stico.

An√°lisis de datos

Ahora que buena parte de los datos cient√≠ficos se obtienen mediante c√°lculos que realiza alg√ļn software, el an√°lisis es la labor m√°s importante del profesional de esta disciplina. Debe poder explorar en ese mar de informaci√≥n, hacer a un lado aquella que no le sirve, construir modelos y presentar los resultados de forma efectiva. 

Para saber m√°s al respecto, te invitamos a echar un ojo a nuestros art√≠culo sobre la interpretaci√≥n de datos. Pero porque t√ļ ya est√°s decidido a ser un cient√≠fico de datos, da el gran salto de tu vida con el curso online de An√°lisis y visualizaci√≥n de data.

Lenguajes de programaci√≥n y otras herramientas 

Seguro que esto ya lo veías venir. Te dijimos que, en gran medida, los datos científicos son procesados por softwares, pero de todas formas debes saber utilizarlos. Algunos de los más famosos dentro de este campo son Spark, Hadoop, Cloudera y Scala.

Por otro lado, est√°n el gestor de bases de datos SQL y el lenguaje estad√≠stico R, que son fundamentales para cualquier cient√≠fico de datos. Y otro que ha ganado gran notoriedad entre los profesionales de esta disciplina es Python. 

En el pasado ya te explicamos qué es Python, un lenguaje de programación tan popular que, dentro de la ciencia de datos, ha comenzado a eclipsar a R. Por eso mismo, hemos considerado su uso en el curso online de Big Data aplicada a los negocios.

Visión de negocio

Puede que seas muy bueno interpretando data, pero si puedes hacerlo desde la perspectiva de un empresario, ser√° mucho mejor. Despu√©s de todo, el prop√≥sito √ļltimo del cient√≠fico de datos es aumentar el valor de las empresas. Ponte en los zapatos de los due√Īos y los inversionistas con el curso online de Convierte ideas en modelos de negocio.

Comunicación de ideas

Aun si tienes los datos cient√≠ficos correctamente procesados e interpretados, ¬Ņcrees saber c√≥mo expresarlos ante un directorio que, posiblemente, no maneje los mismos t√©rminos y conceptos que t√ļ? Haz que todos entiendan tus propuestas con el curso online de Comunicaci√≥n Efectiva.

Convertirse en cient√≠fico de datos es todo un reto, s√≠, pero no es nada que no puedas superar. Ya diste el primer paso al terminar de leer este art√≠culo. Completa tu educaci√≥n con los cursos que te hemos sugerido en el camino. Hazlo y ver√°s c√≥mo se te abrir√°n muchas puertas. 

Crehana Premium