Controlando el Clúster de HDInsight (Hadoop) programáticamente y ahorrando costes: Con C# !!!

Muy buenas, Después de varios posts en los que hemos estado hablando de HDInsight (Hadoop de Microsoft), aun a pesar de quedarnos pendientes muchos puntos sobre los que hablar, en esta ocasión me gustaría profundizar en la gestión automática de HDInsight.   La importancia de este tema radica principalmente en los siguientes puntos: El coste... Seguir leyendo →

Anuncios

HDInsight: Afinando y ajustando tuercas en la nueva versión. El BIGDATA de mis Twitts!

Muy buenas, Antes de nada gracias a todos aquellos a los que os gustan mis posts  y que esperáis que siga con ellos. Sinceramente, esto me anima a continuar y seguir al pie del cañón. En segundo lugar, perdonad por la espera, pero, hay veces que las situaciones personales/profesionales requieren una dedicación mayor de la... Seguir leyendo →

Hadoop On Azure Mahout: Algoritmos de recomendación, Clasificaciones y Agrupaciones (Clustering)

Una vez que ya conocemos los conceptos y componentes principales de Hadoop según vimos en los posts anteriores: Hadoop HiveQL Hive desde Excel, Power Pivot y Power View Sqoop I Sqoop II Continuaremos probando más funcionalidad de y para Hadoop on Azure. En esta ocasíón Mahout. “La verdad es que cuando la semana pasada me... Seguir leyendo →

Windows Azure Hadoop. Understanding, Diving & Solving issues IV. SQL To Hadoop (Sqoop) II

    En el capítulo anterior de Sqoop, veíamos como llevar a cabo una importación y exportación de datos desde SQL Azure hacia y desde Hadoop, concretamente desde y hacia su sistema de ficheros HDFS. Pues bien, en esta ocasión, veremos como conseguir esta importación directamente hacia Hive. 1) Importación de datos desde SQL Azure... Seguir leyendo →

Windows Azure Hadoop. Understanding, Diving & Solving issues IV. SQL To Hadoop (Sqoop) I

  En esta ocasión veremos como Hadoop además de trabajar con datos no estructurados, también puede hacerlo con datos relacionales para ello Hadoop cuenta con otro componente, SQOOP, es decir, SQL To Hadoop. Lo que nos  va a permitir Scoop exactamente, es el traspaso de datos entre SQL Azure y Hadoop (HDFS y Hive) en... Seguir leyendo →

Windows Azure Hadoop. Understanding, Diving & Solving issues III (Consumiendo Hive desde Excel, Power Pivot y Power View)

  Muy buenas, Continuado con Hadoop on Windows Azure y tras los dos post anteriores: “Understanding, Diving And Solving issues” y “Understanding, Diving and Solving Issues II (HiveQL)”, seguiremos con el ejemplo a partir de la Tabla “iislog” creada en HiveQL. Una vez creada y cargada la tabla con la información del fichero de texto... Seguir leyendo →

Windows Azure Hadoop. Understanding, Diving and Solving issues II (HiveQL)

Muy buenas, Siguiendo con Hadoop, veamos que es HiveQL y cómo utilizarlo. Big Data y, como decíamos, “Hadoop On Azure”, contiene muchos componentes, en el post anterior, comentamos y trabajamos sobre uno de ellos, concretamente sobre “C# Streaming”.  En este caso, otro de estos es Hive QL: ¿Que nos dice Wikipedia? Apache Hive es un... Seguir leyendo →

Windows Azure Hadoop. Understanding, Diving and Solving issues

Muy buenas, Esta semana he estado “pegándome” un poco con Hadoop, ¡se acercan bonitos tiempos! y, aunque aún tengo pendiente un par de post sobre HPC, tendrán que esperar por el momento. Cuando hablamos de Hadoop, también hablamos de Big Data, (¡si, efectivamente, muchos datos y muy grandes !), ambos términos están relacionados. Concretamente, Big... Seguir leyendo →

Crea un blog o un sitio web gratuitos con WordPress.com.

Subir ↑

A %d blogueros les gusta esto: