Controlando el Clúster de HDInsight (Hadoop) programáticamente y ahorrando costes: Con C# !!!

Muy buenas, Después de varios posts en los que hemos estado hablando de HDInsight (Hadoop de Microsoft), aun a pesar de quedarnos pendientes muchos puntos sobre los que hablar, en esta ocasión me gustaría profundizar en la gestión automática de HDInsight.   La importancia de este tema radica principalmente en los siguientes puntos: El coste … Sigue leyendo Controlando el Clúster de HDInsight (Hadoop) programáticamente y ahorrando costes: Con C# !!!

Anuncios

HDInsight: Afinando y ajustando tuercas en la nueva versión. El BIGDATA de mis Twitts!

Muy buenas, Antes de nada gracias a todos aquellos a los que os gustan mis posts  y que esperáis que siga con ellos. Sinceramente, esto me anima a continuar y seguir al pie del cañón. En segundo lugar, perdonad por la espera, pero, hay veces que las situaciones personales/profesionales requieren una dedicación mayor de la … Sigue leyendo HDInsight: Afinando y ajustando tuercas en la nueva versión. El BIGDATA de mis Twitts!

Hadoop On Azure Mahout: Algoritmos de recomendación, Clasificaciones y Agrupaciones (Clustering)

Una vez que ya conocemos los conceptos y componentes principales de Hadoop según vimos en los posts anteriores: Hadoop HiveQL Hive desde Excel, Power Pivot y Power View Sqoop I Sqoop II Continuaremos probando más funcionalidad de y para Hadoop on Azure. En esta ocasíón Mahout. “La verdad es que cuando la semana pasada me … Sigue leyendo Hadoop On Azure Mahout: Algoritmos de recomendación, Clasificaciones y Agrupaciones (Clustering)

Windows Azure Hadoop. Understanding, Diving & Solving issues IV. SQL To Hadoop (Sqoop) II

    En el capítulo anterior de Sqoop, veíamos como llevar a cabo una importación y exportación de datos desde SQL Azure hacia y desde Hadoop, concretamente desde y hacia su sistema de ficheros HDFS. Pues bien, en esta ocasión, veremos como conseguir esta importación directamente hacia Hive. 1) Importación de datos desde SQL Azure … Sigue leyendo Windows Azure Hadoop. Understanding, Diving & Solving issues IV. SQL To Hadoop (Sqoop) II

Windows Azure Hadoop. Understanding, Diving & Solving issues IV. SQL To Hadoop (Sqoop) I

  En esta ocasión veremos como Hadoop además de trabajar con datos no estructurados, también puede hacerlo con datos relacionales para ello Hadoop cuenta con otro componente, SQOOP, es decir, SQL To Hadoop. Lo que nos  va a permitir Scoop exactamente, es el traspaso de datos entre SQL Azure y Hadoop (HDFS y Hive) en … Sigue leyendo Windows Azure Hadoop. Understanding, Diving & Solving issues IV. SQL To Hadoop (Sqoop) I

Windows Azure Hadoop. Understanding, Diving & Solving issues III (Consumiendo Hive desde Excel, Power Pivot y Power View)

  Muy buenas, Continuado con Hadoop on Windows Azure y tras los dos post anteriores: “Understanding, Diving And Solving issues” y “Understanding, Diving and Solving Issues II (HiveQL)”, seguiremos con el ejemplo a partir de la Tabla “iislog” creada en HiveQL. Una vez creada y cargada la tabla con la información del fichero de texto … Sigue leyendo Windows Azure Hadoop. Understanding, Diving & Solving issues III (Consumiendo Hive desde Excel, Power Pivot y Power View)

Windows Azure Hadoop. Understanding, Diving and Solving issues II (HiveQL)

Muy buenas, Siguiendo con Hadoop, veamos que es HiveQL y cómo utilizarlo. Big Data y, como decíamos, “Hadoop On Azure”, contiene muchos componentes, en el post anterior, comentamos y trabajamos sobre uno de ellos, concretamente sobre “C# Streaming”.  En este caso, otro de estos es Hive QL: ¿Que nos dice Wikipedia? Apache Hive es un … Sigue leyendo Windows Azure Hadoop. Understanding, Diving and Solving issues II (HiveQL)