Pentaho 8: ecco le funzionalità della nuova versione

Funzionalità e miglioramenti in Pentaho 8

L’acquisizione di Pentaho da parte di Hitachi: cosa è cambiato

In questo articolo vedremo quali sono le novità di Pentaho 8 rispetto alle versioni precedenti del software.

Giunto ormai alla versione 8.0, il pacchetto software open source Pentaho è stato lanciato sul mercato una decina di anni fa. Nel 2015 arriva l’acquisizione di Pentaho da parte di Hitachi Data Systems (HDS), che lo integra nella propria offerta senza però intaccarne le caratteristiche originali. Questo almeno fino agli ultimi mesi, poiché il brand Hitachi ha di recente comunicato l’intenzione di riunire Hitachi Data Systems (HDS), Hitachi Insight Group, responsabile principale della piattaforma Lumada IoT, e lo stesso Pentaho in un nuovo prodotto denominato Hitachi Vantara.

Nonostante i cambiamenti avvenuti a livello di brand, Pentaho conserva integre le proprie funzionalità base e nella sua nuova versione si appresta ad apportare sia novità che miglioramenti sostanziali. Il primo miglioramento riguarda l’assetto di Pentaho, che pur essendo ancora legato alla Business Intelligence e alla Business Analytics ha allargato i propri orizzonti a campi quali il data integration, con il Pentaho Data Integration (PDI), e il data mining, con il Data Science Pack.

Per riprendere le parole pronunciate dai rappresentanti di Hitachi Vantara, le novità di Pentaho 8 possono essere divise in tre grandi categorie: il miglioramento della connettività alle sorgenti dati per l’elaborazione in tempo reale degli stessi, l’ottimizzazione dei processi relativi alle sorgenti dati ed infine l’agevolazione della produttività di gruppo. Per capire meglio i cambiamenti apportati è necessario analizzare ogni miglioramento in maggior dettaglio.

Trasferimento dei dati in Pentaho 8

Pentaho 8Per quanto riguarda il trasferimento dei dati in Pentaho 8 è possibile notare l’aggiunta di funzionalità per il supporto di due progetti dell’Apache Software Foundation, rispettivamente Kafka e Spark. Kafka fa uso di un nuovo connettore per il trasferimento dei dati, mentre Spark, e in particolare il tool Spark Streaming, è utilizzato principalmente per elaborare i suddetti dati.

L’elaborazione in tempo reale dei dati è invece compito della funzionalità Adaptive Execution Layer (AEL), già implementata nella versione 7.1 di Pentaho. È importante sottolineare come in Pentaho 8 è possibile combinare le caratteristiche dei motori di data integration Kettle e Spark, utilizzando Kettle nella fase di sviluppo e prova e Spark nella fase di produzione. È stato inoltre annunciato il futuro supporto di altri motori di data integration.

Gestione dell’elaborazione delle sorgenti dati

Hitachi Vantara ha deciso di attribuire a Pentaho 8 un’architettura scale-out, ovvero un’architettura distribuita, permettendo così di utilizzare il motore Kettle su cluster di nodi e non solo su un server singolo. I nodi non elaborano i dati unicamente secondo un principio di distribuzione, ma eseguono più elaborazioni contemporaneamente; questo vuol dire che Kettle e Spark possono essere utilizzati in un unico cluster.

L’uso di Kettle su cluster di nodi è un modo per i manager del settore IT di ottenere il massimo risultato a prescindere dal numero di computer presenti. Aggiungendo nodi e distribuendo su di essi il carico di lavoro simultaneamente è possibile rispondere in modo efficace ed immediato alle richieste degli utenti. Si tratta di una mossa intelligente per migliorare l’utilizzo congiunto di cloud e on-premise.

Non solo, la funzionalità Adaptive Execution Layer (AEL) di Pentaho permette agli utenti di distribuire il carico di lavoro sul motore più idoneo, senza essere costretti a riscrivere alcuna logica di data integration.

Oltre ai cluster di Cloudera, già supportati nella precedente versione, Pentaho è in grado di supportare i cluster di Hortonworks Hadoop e di Spark. Piuttosto pesante è anche lo zampino di Apache, grazie all’aggiunta del supporto per Apache Knox per quanto riguarda l’autenticazione e il supporto per i formati di file Apache Avro e Parquet.

I miglioramenti nella produttività di gruppo

La nuova versione di Pentaho permette agli utenti una migliore preparazione dei dati per il processo di elaborazione, grazie alla presenza di filtri per individuare velocemente e con facilità i dati duplicati o mancanti. Per la visualizzazione dei dati e una migliore comprensione è anche possibile ricorrere alla compilazione e alla pubblicazione di schemi preliminari.

L’accesso facilitato alla piattaforma e ai contenuti contribuisce a migliore la user experience relativa a Pentaho Data Integration, mentre l’incremento degli strumenti di controllo è utile per la revisione delle applicazioni utilizzate, specialmente in relazione alla compatibilità di Opsmart con database come Oracle, SQL Server e MySQL.

Altre funzionalità della nuova versione di Pentaho

Pentaho 8Le altre novità legate al rilascio della versione 8.0 di Pentaho riguardano, ad esempio, il componente Data Explorer di Pentaho Data Integration. In fase iniziale Data Explorer consentiva di visualizzare i dati durante la preparazione e la trasformazione, ma è stato ora arricchito da una funzione di filtraggio che in precedenza non era disponibile. A ciò si aggiungono una maggiore facilità d’uso e una maggiore semplicità di controllo e revisione.

L’evoluzione di Pentaho dopo l’acquisizione da parte di Hitachi risulta quindi evidente nell’applicabilità del prodotto alla Enterprise Business Intelligence, alla data science e all’Internet of Things, dovuta al supporto di importanti tecnologie e standard open source per i big data. Quello che resta da fare è attendere i nuovi sviluppi di supporto.

Supporto e assistenza per l’uso di Pentaho

La nuova versione di Pentaho è uno strumento efficace nelle mani di aziende che vogliono dare una marcia in più sia alla user experience che alla produttività in loco. Per sfruttarne al meglio le potenzialità però può essere necessario ricorrere alla consulenza di un team professionale in grado di fornire consigli e consulenza in materia.

Scegliere Nextre Engineering per approcciarsi con successo a Pentaho e ai suoi diversi rilasci significa fare affidamento su una realtà con oltre quindici anni di esperienza nel settore ICT. Nextre Engineering non si limita a consigliare al cliente le migliori strategie di azione, ma si occupa di fornirgli una formazione completa su come utilizzare il software e far fronte in autonomia a situazioni critiche.

Scopri quali sono le nostre soluzioni riguardo a Pentaho

Soluzioni Pentaho