Los cambios que ha traído la sociedad de la información no sólo han afectado a las actividades documentales con el tiempo, sino también a la información misma. Esto también hablando de las diversas formas de su uso, como el crear y compartir información, al igual que analizarla e interpretarla. Las nuevas tecnologías y los nuevos medios suponen un área propia de estudios al momento de relacionarlos con otros conceptos como el Big Data, la Inteligencia Artificial, el Machine & Learning, al igual que las Ciencias de Datos. Esta investigación abordará estos conceptos de una manera más detallada.
El Big Data
Según Rick Smolan, el autor de El Rostro Humano de Big Data, esta es "una extraordinaria revolución del conocimiento opera casi invisible , a través de los negocios , la academia, el gobierno, la salud y la vida cotidiana". Es un término muy de moda hoy en día y lo estamos escuchando constantemente en los medios tanto en prensa escrita como en otros grupos de medios. Por un lado, nos podemos referir tanto a la infraestructura como a la tecnología que nos permite almacenar los datos y analizarlos. Pero también nos referimos al proceso de toma de decisiones por el cual por medio de estos datos las empresas de la información son capaces de tomar decisiones mucho más objetivas y que les aportan un valor de negocio diferencial.
Se trata de una mega tendencia porque está cambiando la forma radical en la cual se toman decisiones en el día a día de las grandes compañías y que permiten tomar decisiones tomar mucho más rápido y objetivo. El impacto de la Big Data en la información puede verse desde varios puntos de vista: Desde una mejora en la forma de obtenerla por medio de una diversidad de fuentes, y por otro lado en una optimización o reducción de lo que se requiere para crearla, obtenerla, modificarla, compartirla, entre muchas otras acciones.
El Big Data permite conocer mejor a las personas y así ofrecerles mejor productos informativos, obteniendo una mejora no solo económica sino social. Por medio de esta optimización y sus relaciones, puede hacer más eficiencia maximizando las ventajas competitivas. Al momento de hacer una estrategia de Big Data es muy importante empezar viendo la información que primero se dispone, una vez que se sabe eso es necesario ver si hubiera algún otro tipo de información la cual no estamos almacenando y fuera de vital importancia que pudiera aportar un valor.
Esto podría verse como los "ingredientes" que las tecnologías de la información tiene, siendo capaz de construir unos "buenos platos". Finalmente mejorar las áreas con los datos que han sido recolectados, analizados e interpretados para que permitan una concientización, educación y consumo óptimo.
Inteligencia Artificial
Pasando ahora a la Inteligencia artificial, es una tecnología con la cual podemos hacer programas que aprendan por su cuenta solucionar problemas en vez de que nosotros tengamos que escribir y hacer esfuerzo. Según la Fundación General CSIC, la inteligencia artificial es una de las ramas de la informática, con fuertes raíces en otras áreas como la lógica y las ciencias cognitivas.
El solucionar problemas por nuestra cuenta puede llegar a ser muy tedioso y tomar bastante tiempo, en cambio con la inteligencia artificial lo único que tenemos que hacer es darle un montón de ejemplos del problema siendo solucionado a nuestro programa. Estos ejemplos pueden ser textos, pueden ser números, imágenes, entre otros. Ésta puede identificar programas para solucionar por su cuenta.
Relacionándola con las tecnologías de la información, las empresas de información la usan no solo para buscar y resolver, sino para generar predicciones del mercado o predicciones de venta. Se basan en las experiencias del pasado y el presente para lograrlo, pues uno puede ser semejante al otro en algunas cosas. En resumen, puede aplicarse a todas las áreas que existen para un sin fin de tareas que tengan la finalidad de facilitar y hacer las cosas de la mejor manera posible en el futuro.
Machine Learning
El Machine Learning se refiere a la capacidad de aprender. Es decir, el aprendizaje automático, es la rama de la inteligencia artificial que estudia cómo dotar a las máquinas de capacidad de aprendizaje. Entendido éste como la generalización del conocimiento a partir de un conjunto de experiencias. Este aprendizaje puede dividirse en tres grupos diferentes: aprendizaje supervisado, no supervisado y reforzado.
Según la página oficial de Aprende Machine Learning, en el Aprendizaje Supervisado los datos para el entrenamiento incluyen la solución deseada, llamada “etiquetas” (labels). Un ejemplo claro de este último es el de clasificar los correos entrantes, viendo si son Spam o no. Hablando del Aprendizaje No Supervisado, los datos de entrenamiento no incluyen Etiquetas y el algoritmo intentará clasificar o descifrar la información por sí solo. Un ejemplo de éste es cuando la inteligencia observa las distintas cosas que tienen los grupos online en común. Finalmente, el Reforzado determina las acciones a llevar a cabo por medio de la prueba y error. Así puede conseguir por sí mismo recompensas y soluciones.
Ésta no es una disciplina cualquiera dentro de las tecnologías de la información, es un componente nuclear que de hecho se relaciona y conecta con el resto de las categorías de la inteligencia artificial, porque todas las otras capacidades pueden ser limitadas ya sea porque alguien las haya programado o mucho más interesante, porque el propio sistema haya aprendido a realizarlas. Una cosa es programar una máquina para que pueda moverse, y otra es programarla para que aprenda a moverse. He ahí la gran diferencia, poniendo un ejemplo. Es muy común confundir la inteligencia artificial con el Machine Learning, pero hay que tener en cuenta a base de lo planteado que se relacionan íntimamente a pesar de no ser lo mismo.
Deep Learning
Hablando de los algoritmos de Deep Learning, necesitamos estas técnicas tan complejas porque se entrenan y aprenden a partir de los datos y actualmente nos encontramos inmersos en la era de la información. Con la llegada de la digitalización el abaratamiento de los dispositivos de almacenamiento y un cambio de mentalidad a la hora de apreciar el valor de los datos, hemos entrado en una tendencia de acumular más y más datos e información. Así es como volvemos a regresar con el concepto núcleo del principio, el Big Data.
Las diferencias que tiene el Deep Learning con el Machine Learning, es que el Deep Learning es un tipo de algoritmo más sofisticado creado a partir de los principios de redes neuronales. A diferencia, puede soportar y trabajar mejor con grandes cantidades de información como una mente única, haciendo posible los avances de aprendizaje automático gracias a la accesibilidad de los datos.
Por tanto, el fenómeno de acumular grandes cantidades de datos resulta indispensable para los procesos de análisis desde el momento en el que son capturados hasta que se transforma en conocimiento. Para esto, se requieren de potentes y complejas técnicas ya mencionadas del Deep Learning, una familia de algoritmos de aprendizaje automático que han dado un nuevo resurgir al campo del Machine Learning. Y por tanto, al campo de la inteligencia artificial.
La Ciencia de datos
La Ciencia de los datos podría decirse que es la parte analítica de los datos. Desde cierta perspectiva, podría decirse que la Ciencia de los datos también es la evolución del Data Mining, que es aplicar diferentes tipos de algoritmos para estructurar y organizar datos. Cuando hacemos este análisis enorme de datos con la Ciencia de los datos, nuevamente regresamos al concepto núcleo del Big Data. Porque desde el punto de vista de las tecnologías de la información, no se podría analizar a partir de un solo servidor ya que sería una dificultad muy grande al manejar un volumen masivo de datos.
Datos → Información → Conocimiento → Saber
Entonces lo mejor sería tener varios equipos que funcionen y trabajen de manera coordinada y a partir de ahí que surjan nuevas tecnologías. Después de todo en el fondo, no deja de ser un sub elemento de la Ciencia de los datos. Probablemente llegará un momento en el que este problema operativo pueda solucionarse de una manera más efectiva y eficaz, donde los softwares se adapten a manejar cada vez más información procesada. Los objetivos pueden ser los mismos, pero la manera de lograrlo siempre puede ser optimizada.
Ideas Finales
En conclusión, hay ciertas características principales de la Big Data en relación con estos términos: son sumamente grandes (obviamente), se generan continuamente porque nuevos datos llegan cada segundo, se buscan los datos que en la mayoría de los casos son variables. Eso no significa necesariamente que hay necesidad de comprar maquinaria o Ciencia de datos.
Con las tecnologías de la información hay una expectativa alta debido a la manera como optimizan el tiempo y hacen más eficientes los procesos de generación, almacenamiento y difusión de contenidos dentro del negocio y almacenamiento de la información. Al mismo tiempo sigue en la búsqueda de encontrar el máximo de beneficios por medio de la mejora de la calidad de obtención de contenidos en masa. Al final depende de las actualizaciones y mejora de procesos que puede ofrecer la tecnología.
Comentarios
Publicar un comentario