Conviértete en científico de datos y aprende qué es la ciencia de datos desde lo más básico

Conviértete en científico de datos y aprende qué es la ciencia de datos desde lo más básico

Última actualización 16 de Marzo del 2021Tiempo de lectura: 7 min.

Ronald Cotaquispe

El científico de datos es un profesional imprescindible en las empresas hoy en día. Tal es así que, literalmente, estas no pueden hacer nada sin él. ¿Quieres ser así de importante en tu trabajo? Pues en este blog post te diremos cómo lograrlo.

Te vamos a explicar qué es la ciencia de datos y te daremos algunos ejemplos concretos, pues si bien la definición de esta disciplina no es complicada, ponerla en práctica puede significar un reto mayúsculo.

Al terminar este artículo, sabrás qué necesitas para dedicarte a la ciencia de datos y estarás listo para iniciar tu rumbo en esta carrera. No te perderás ni un solo dato importante, comenzando con los que hemos ordenado para ti en nuestro índice.

Índice  

  1. ¿Qué es la ciencia de datos?
  2. ¿Qué es la data?
  3. La ciencia de datos y el Big Data
  4. Conceptos clave de la ciencia de datos
  5. 5 habilidades de todo científico de datos

¿Qué es la ciencia de datos?

Para entender a qué se dedica un científico de datos, la primera fuente que podemos consultar es Wikipedia, que se refiere a esta profesión como “un campo interdisciplinario que utiliza métodos, procesos, algoritmos y sistemas científicos para extraer conocimiento e información”, la cual después es interpretada y usada para tomar decisiones.

¿Te parece una definición muy complicada? En nuestro artículo anterior sobre qué es la ciencia de datos ahondamos más en este punto y lo sintetizamos en una frase muy sencilla: de lo que se trata es de convertir la información en conocimiento útil.

Pongamos un ejemplo práctico: imagina que acabas de abrir tu tienda online de regalos para parejas. Luego de llevar el curso online de Domina Google Analytics y la Analítica Digital, puedes aplicar los principios de la ciencia de datos para recabar información sobre el perfil de las personas que entran al sitio web, cuántos realizan una compra, en qué momento lo hacen, etc.

Luego, llegas a la conclusión de que tus compradores más frecuentes son hombres entre 25 a 45 años, quienes mayormente piden ramos de flores y lo hacen a fin de mes. Tú, como el buen científico de datos que aspiras a ser, puedes idear promociones especiales para esas fechas. O quizás ese no es el público que habías ideado al principio, así que usas nuestra plantilla de plan de marketing digital para reformular toda tu estrategia.

Entonces, ya sabes en principio qué es la ciencia de datos. Pero ¿es simplemente ver números y estadísticas, y actuar en base a ellas? Pues no, nada más lejos de la verdad. Y es que la información no siempre te va a llegar de forma tan clara y acorde a tu negocio. 

No por nada existe toda una carrera de Ingeniería en Ciencias de Datos y Matemáticas, que abarca múltiples conocimientos. Sin embargo, todos parten de un punto esencial: la data, que es lo que vamos a ver en la siguiente sección.

científico de datosFuente: Unsplash

¿Qué es la data?

Todo científico de datos entiende que la data, como señala Wikipedia, “es una representación simbólica (numérica, alfabética, algorítmica, espacial, etc.) de un atributo o variable”. En otras palabras, es un valor o referente que se le otorga a un hecho empírico, suceso o entidad.

Si te cuesta entender qué es la data, no te preocupes, te lo vamos a poner fácil. Imagina que tienes un restaurante y un grupo importante de comensales siempre pide hamburguesas, otro siempre pregunta si hay una opción vegana en el menú y tu local cada vez está menos lleno y hay más pedidos por delivery.    

Todo eso que acabas de ver son hechos empíricos; para convertirlos en datos científicos debes registrarlos y atribuirles una variable, que te permitirá medir la magnitud de dicho fenómeno. Tal como su propio nombre lo indica, la variable es algo que siempre varía.

Sobre el caso anterior, una variable sería la cantidad de personas que pide delivery, que en un universo de 100 clientes pasó de 20 a 40. Como científico de datos, esa es la información que procesas para dar una recomendación, por ejemplo, atender este cambio en la demanda con una app propia del restaurante, una que podrías desarrollar con el curso online de Crea aplicaciones en Android con Java.

En nuestro artículo sobre la interpretación de datos y su importancia para tu negocio, ya te habíamos hablado sobre la variable y precisamos que esta puede ser de dos tipos: cuantitativa o cualitativa. Es importante que conozcas ambos si piensas dedicarte a la ciencia de datos.  

Variable cuantitativa

Un científico de datos sabe que las variables cuantitativas son aquellas que otorgan un valor numérico. Al respecto, dos buenos ejemplos que da la Enciclopedia Económica son la altura y peso, que son dos realidades a las que nos podemos referir con cifras que son universalmente entendibles y aceptadas.

El mismo portal señala que las variables cuantitativas pueden ser discretas o continuas. En el primer caso, hablamos de cifras que se encuentran separadas en escalas y, por tanto, no admiten valores entre ellas. Por tanto, son datos científicos que se expresan en números enteros. Por ejemplo, si quieres saber cuántos hijos tiene una persona, pueden ser 2 o 3, pero nunca un 1 y medio.  

Por su parte, las variables cuantitativas continuas sí admiten valores en medio de dos exactos. Un ejemplo de ello sería el dinero, pues sí admite decimales (0.50, 25.45, 654.56, etc.). De hecho, un científico de datos seguramente va a trabajar con cifras relacionadas a montos.

Quienes entienden qué es la data saben también que las variables cuantitativas pueden representarse en diagramas de barras, donde a puede apreciarse el valor numérico de cada cosa que queramos medir, por ejemplo, cuántas órdenes hubo de cada platillo del menú. 

Por otro lado, también existen los diagramas integrales y diagramas diferenciales, donde se observa la frecuencia relativa de cada variable. Aquí, un científico de datos observaría el número de pedidos por delivery de cada mes y se percataría de una curva ascendente. Eso ya te lo habíamos explicado al tocar la importancia de usar gráficos estadísticos.  

Data ScienceFuente: Kanger

Variable cualitativa

En la ciencia de datos, la variable cualitativa expresa una característica, atributo, cualidad o categoría no númerica. Un buen ejemplo, otra vez dado por Enciclopedia Económica, es el sexo, que puede ser categorizado como masculino o femenino, pero no con una cifra.

Hay tres tipos de variables cualitativas, empezando por las nominales, que son matemáticamente las menos precisas para el científico de datos. Un ejemplo de esto serían los colores, que pueden ser rojo, blanco, amarillo, azul, etc.

Luego, están las ordinarias, que son datos científicos que sí contemplan un orden, como cuando se habla del nivel socioeconómico de las personas: alto, medio o bajo. Y, por último, están las binarias, que son las variables cualitativas que solo admiten dos valores, como en aquellas encuestas que te piden responder sí o no, o verdadero o falso.

¿Tienes problemas para calcular los intereses ganados? Hazlo fácil con nuestra plantilla de Excel

¿Tienes problemas para calcular los intereses ganados? Hazlo fácil con nuestra plantilla de Excel

La ciencia de datos y el Big Data

Ser un científico de datos se ha puesto de moda, pero eso no significa que se trate de un fenómeno reciente. Por el contrario, según Wikipedia, tiene su origen en 1962, cuando John W. Tukey publicó su artículo The Future of Data Analysis en la revista Anales de estadística matemática.

En ese momento, por primera vez se habla de una “ciencia de datos”​, pero no fue sino hasta el 2001, con la publicación de un ensayo de William S. Cleveland, que se le reconoce una disciplina independiente de otras, entre otras cosas, por el avance de la computación. 

Con ella, fuimos capaces de almacenar volúmenes de información como nunca antes en la historia, tanto que fue necesario acuñar una nueva expresión para referirse a este fenómeno. Fue así como nació “Big Data” (o macrodatos, en español), que va más allá de lo que es la data común y corriente. 

Aunque hay mucha bibliografía al respecto, que incluye nuestro artículo sobre qué es Big Data Analytics y el curso online de Big Data aplicada a los negocios, a este concepto se le suele confundir con el de ciencia de datos. Pero, si bien ambos van de la mano, no son exactamente lo mismo.

Como ya dijimos anteriormente, Big Data se refiere a conjuntos de datos tan grandes que, para su correcto almacenamiento, gestión, procesamiento y análisis, hacen falta softwares especializados. Mientras, el Data Science consiste en transformar todo eso en información de valor para las empresas.

Data Science and Business Intelligence | Grazitti Interactive

Fuente: Grazitti Interactive

Conceptos clave de la ciencia de datos

Para ser científico de datos, deberás aprender muchos conceptos procedentes de una gran variedad de disciplinas, pero por el momento es importante que te queden en claro tres, los cuales son los pilares de tu futuro trabajo.

Data Mining

Según la Escuela de Negocios de la Innovación y los Emprendedores (IEBS) de México, este es un conjunto de técnicas y tecnologías que permiten recolectar y almacenar grandes bases de datos científicos de manera automática o semiautomática.

Después, entre todo ese cúmulo de información, el científico de datos busca patrones repetitivos que expliquen algún comportamiento que considere interesante para el negocio, para lo cual se utilizan algoritmos matemáticos. El resultado de esto son estrategias más efectivas.

Deep Learning

Analytics Software & Solution señala que esta es una rama de la inteligencia artificial que se basa en la idea de que los sistemas pueden aprender de los datos científicos, identificar patrones y tomar decisiones con una mínima intervención humana.

En ese sentido, el Deep Learning (o aprendizaje automático) es un método de análisis automatizado, lo que no significa que los sistemas informáticos hagan todo el trabajo en lugar del científico de datos. Más bien, se trata de ‘educar’ a la tecnología para que corrija errores por sí sola.

Inteligencia artificial 

La página del Máster en Data Science de la Universidad de Alcalá reconoce la importancia de esta tecnología al ser capaz de procesar cantidades masivas de datos que serían imposibles para un ser humano. 

Por su parte, en el 2017, la firma global de investigación Gartner había pronosticado que en el 2020 más del 40 % de las tareas del científico de datos iba a ser automatizado, es decir, realizado por una inteligencia artificial. Razón más que suficiente para que seas un experto en su uso y desarrollo.   

¿No sabes cómo administrar tus ventas diarias? Te damos tres formatos de Excel que te ayudarán

¿No sabes cómo administrar tus ventas diarias? Te damos tres formatos de Excel que te ayudarán

5 habilidades de todo científico de datos

Ya sabes de sobra qué es la ciencia de datos, y si ya estás pensando en adentrarte en este campo, toma nota de los conocimientos y las habilidades que te harán falta. Considera cuántos de ellos ya tienes y cuántos te faltan adquirir aún.

Matemáticas

Según Keep Coding, el científico de datos no tiene que ser un matemático puro, pero sí debe entender los fundamentos de ramas como el álgebra lineal, el cálculo, los algoritmos y la estadística, que puedes entender un poco más con nuestro artículo sobre qué es el análisis estadístico.

Análisis de datos

Ahora que buena parte de los datos científicos se obtienen mediante cálculos que realiza algún software, el análisis es la labor más importante del profesional de esta disciplina. Debe poder explorar en ese mar de información, hacer a un lado aquella que no le sirve, construir modelos y presentar los resultados de forma efectiva. 

Para saber más al respecto, te invitamos a echar un ojo a nuestros artículo sobre la interpretación de datos. Pero porque tú ya estás decidido a ser un científico de datos, da el gran salto de tu vida con el curso online de Análisis y visualización de data.

Lenguajes de programación y otras herramientas 

Seguro que esto ya lo veías venir. Te dijimos que, en gran medida, los datos científicos son procesados por softwares, pero de todas formas debes saber utilizarlos. Algunos de los más famosos dentro de este campo son Spark, Hadoop, Cloudera y Scala.

Por otro lado, están el gestor de bases de datos SQL y el lenguaje estadístico R, que son fundamentales para cualquier científico de datos. Y otro que ha ganado gran notoriedad entre los profesionales de esta disciplina es Python. 

En el pasado ya te explicamos qué es Python, un lenguaje de programación tan popular que, dentro de la ciencia de datos, ha comenzado a eclipsar a R. Por eso mismo, hemos considerado su uso en el curso online de Big Data aplicada a los negocios.

Visión de negocio

Puede que seas muy bueno interpretando data, pero si puedes hacerlo desde la perspectiva de un empresario, será mucho mejor. Después de todo, el propósito último del científico de datos es aumentar el valor de las empresas. Ponte en los zapatos de los dueños y los inversionistas con el curso online de Convierte ideas en modelos de negocio.

Comunicación de ideas

Aun si tienes los datos científicos correctamente procesados e interpretados, ¿crees saber cómo expresarlos ante un directorio que, posiblemente, no maneje los mismos términos y conceptos que tú? Haz que todos entiendan tus propuestas con el curso online de Comunicación Efectiva.

Convertirse en científico de datos es todo un reto, sí, pero no es nada que no puedas superar. Ya diste el primer paso al terminar de leer este artículo. Completa tu educación con los cursos que te hemos sugerido en el camino. Hazlo y verás cómo se te abrirán muchas puertas. 

Crehana Premium

También podría interesarte

Subcategorías

Softwares