Azure Synapse Analytics: cos'è, vantaggi e come configurarlo
Azure Synapse Analytics unifica big data e data warehouse in un'unica piattaforma Microsoft. Funzionalità, casi d'uso e configurazione per l'analisi enterprise.
Cos’è Azure Synapse Analytics
Azure Synapse Analytics è il servizio di analytics integrato di Microsoft Azure che combina data warehousing enterprise e elaborazione big data in un’unica piattaforma.
Per una panoramica generale di Azure Synapse — architettura, confronto con Data Factory e modelli di pricing — consulta il nostro articolo introduttivo. Fornisce un pool SQL dedicato per query di warehouse strutturate, SQL serverless per interrogazioni on-demand sul data lake, pool Apache Spark per data engineering e integrazione nativa con Power BI e Azure Machine Learning.
Identificare insight nei dati aziendali con Azure Synapse Analytics
Azure Synapse Analytics: caratteristiche e funzioni
Azure Synapse Analytics è un servizio di analisi definito da Microsoft come “senza limiti”, che vanta funzionalità estese come il calcolo provisionato, l’isolamento dei carichi di lavoro, l’integrazione con Power BI, Azure ML e Apache Spark, l’analisi in streaming, l’ingestione ibrida dei dati, la sicurezza a livello di colonna e riga, il mascheramento dinamico dei dati e molto altro ancora.
Si tratta di un’evoluzione di Azure SQL Data Warehouse (DW) con alcuni miglioramenti significativi come le query on-demand come servizio e, con un’integrazione più profonda con altri stack tecnologici, consente agli utenti di recuperare in modo sicuro dati da fonti come un data warehouse, un data lake e sistemi di analisi dei big data, accelerando così il passaggio dai dati grezzi agli insight aziendali.
Inoltre, la piattaforma consente ai clienti di sfruttare tecnologie all’avanguardia come Power BI, Azure Machine Learning e gli ultimi ritrovati nel campo dell’intelligenza artificiale.
In breve, Azure Synapse Analytics una piattaforma unica per analizzare tutti i dati della propria organizzazione senza dover copiare o spostare terabyte di informazioni, potenziando così le capacità di self-service. Anche gli utenti aziendali, con conoscenze tecniche minime, possono recuperare dati attraverso i silos dipartimentali senza nessuno sforzo particolare.
Utilizzando il familiare linguaggio SQL, il servizio consente agli utenti di interrogare dati sia relazionali che non relazionali. L’analisi e l’esplorazione dei dati possono essere effettuate sia utilizzando query on-demand serverless per analisi ed esplorazioni ad hoc, sia utilizzando risorse provisioned (pool SQL dedicato) per esigenze di data warehouse prevedibili e impegnative.
Un pool SQL serverless fornisce accesso a file esterni archiviati in Azure Storage senza richiedere che i dati vengano copiati o caricati in un’altra posizione, utilizzando il dialetto T-SQL. I workspace di Synapse includono questo servizio di default, quindi gli utenti possono utilizzarlo non appena il loro workspace viene creato.
Con questo approccio, non c’è infrastruttura da mantenere e non ci sono costi associati al mantenimento dei servizi in esecuzione. Il servizio è tariffato in base al consumo, quindi i costi sono basati solo sui dati processati dalle query. Limiti di budget per i dati (TB) possono essere utilizzati per controllare i costi dei dati utilizzati in un giorno, una settimana o un mese.
Un data warehouse aziendale può beneficiare di un pool SQL dedicato. I dati sono archiviati in tabelle con storage colonnare, il che migliora le prestazioni e riduce i costi. Viene anche utilizzata un’architettura di elaborazione parallela per eseguire le query.
Questa funzionalità non è abilitata di default in Azure Synapse Analytics; pertanto, è necessario creare un pool e selezionare i livelli di prestazione pertinenti, che possono essere modificati in seguito. Il costo di un pool dedicato è determinato per ora, ma può essere controllato scalando il servizio verso l’alto o verso il basso quando necessario. I pool possono anche essere sospesi quando non sono in uso.
Oltre alle sue capacità principali, Azure Synapse Analytics offre anche le seguenti funzionalità:
- Esplorazione dei data lake: non è sempre stato facile analizzare i dati per alcuni formati di file o richiedeva strumenti aggiuntivi. Un file Parquet, ad esempio, è ottimo per la memorizzazione ma difficile da leggere poiché è altamente compresso. Utilizzando Synapse, possiamo fare clic con il tasto destro su un file e aprirlo con uno script SQL in maniera facile e veloce.
- Scelta del linguaggio: Synapse Analytics supporta diversi linguaggi e gli utenti possono scegliere tra T-SQL, Python, Scala, Spark SQL o .Net per risorse serverless o dedicate, in base alle loro preferenze.
- Supporto per Delta Lake: il servizio è compatibile con Delta Lake della Linux Foundation, uno strato di archiviazione open-source che fornisce transazioni ACID (acronimo di atomicità, coerenza, isolamento, durabilità, le quattro proprietà fondamentali di una transazione nei database, essenziali per garantire la loro integrità e affidabilità) per carichi di lavoro Apache Spark e big data. Inoltre, include il time travel (versioning dei dati) e gestisce metadati scalabili.
- Percorso sinaptico per Azure: questo strumento semplifica e accelera la migrazione dei data warehouse on-premises e cloud ad Azure Synapse Analytics. Collegandosi al sistema di origine, esamina i dettagli sugli oggetti del database e fornisce un rapporto di valutazione dettagliato.
L’architettura di Azure Synapse Analytics
Synapse è una piattaforma che si inserisce nel panorama delle applicazioni di Online Analytical Processing (OLAP), generalmente utilizzate per archiviare e processare grandi volumi di dati raccolti da varie fonti, che possono essere trasformati e/o modellati nel repository OLAP. Successivamente, i grandi dataset vengono aggregati per report ad hoc e casi d’uso analitici.
La piattaforma supporta diversi linguaggi come SQL, Python, .NET, Java, Scala e R e supporta due tipi di runtime analitici, SQL e Spark, che possono elaborare dati in modalità batch, streaming e interattiva ed è inoltre integrata con numerosi altri servizi di dati di Azure, ad esempio Azure Data Catalog, Azure Lake Storage, Azure Databricks, Azure HDInsight, Azure Machine Learning e Power BI.
Synapse Studio
Synapse Studio è un tool SaaS basato sul web che permette agli sviluppatori di lavorare con ogni aspetto della piattaforma da una singola console. Si tratta in buona sostanza della plancia di comando dell’intera piattaforma.
Nel ciclo di sviluppo di una soluzione analitica utilizzando Synapse, si inizia generalmente creando uno spazio di lavoro e lanciando questo tool che fornisce accesso alle diverse funzionalità di Synapse come l’importazione dei dati tramite meccanismi di importazione o pipeline dati, la creazione di flussi dati, l’esplorazione dei dati tramite notebook, l’analisi dei dati con job Spark o script SQL, e infine la visualizzazione dei dati per scopi di reporting e creazione di dashboard.
Questo strumento fornisce anche funzionalità per la creazione di artefatti, il debug del codice, l’ottimizzazione delle performance mediante l’analisi di metriche, l’integrazione con strumenti CI/CD e molto altro ancora.
Panoramica di Azure Synapse Studio
Strumenti per l’integrazione dati
Ci sono diversi strumenti che possono essere utilizzati per caricare i dati in Synapse. Tuttavia, avere un motore di orchestrazione integrato aiuta a ridurre la dipendenza e la gestione di istanze di strumenti separati e di pipeline dati.
Synapse include un motore di orchestrazione integrato identico a quello di Azure Data Factory per creare pipeline dati e ricche capacità di trasformazione dei dati direttamente nello spazio di lavoro di Synapse stesso.
Le principali caratteristiche includono il supporto di oltre 90 origini dati, tra cui quasi 15 origini dati basate su Azure, 26 data warehouse e database open-source e cross-cloud, 6 origini dati basate su file, 3 origini dati basate su NoSQL, 28 servizi e app che possono fungere da fornitori di dati, nonché 4 protocolli generici, tra cui ODBC e REST. Le pipeline possono essere create utilizzando modelli integrati da Synapse Studio per integrare dati da varie fonti.
Synapse SQL Pools
Synapse SQL è il motore di analisi basato su T-SQL di Azure Synapse, progettato per la manipolazione ad alte prestazioni dei dati strutturati. Questa funzionalità fornisce le stesse caratteristiche di data warehousing che erano disponibili nelle versioni precedenti di questo servizio, dove viene allocata una capacità fissa di unità DWU (Data Warehouse Units, unità di calcolo che determinano la potenza e la capacità di elaborazione dei dati) all’istanza del servizio per l’elaborazione dei dati.
La novità in Synapse è che ora questo motore è disponibile sia nella tradizionale modalità Provisioned che nella nuova modalità On-demand.
Synapse ha introdotto una serie di miglioramenti nei pool SQL a partire dalle capacità di gestione dei workload, che consentono agli utenti di perfezionare l’allocazione delle risorse tra questi ultimi. C’è anche la funzionalità COPY ad alte prestazioni per il caricamento dei dati da account di storage esterni. Infine, miglioramenti come la clausola PREDICT integrano l’AI e il machine learning permettendo la valutazione nativa dei modelli direttamente all’interno di Transact-SQL.
SQL on-demand è un’aggiunta degna di nota perché affronta un problema che, in passato, era un compromesso intrinseco nel design dei sistemi di dati aziendali. Il calcolo on-demand affronta i carichi di lavoro imprevedibili e fornisce un altro set di strumenti all’interno dell’architettura dei dati. Esplorare il Data Lake, che sia memorizzato come Parquet, Orc o CSV, è adesso facile come un clic destro.
SQL On-demand include anche nuovi miglioramenti per i compiti ELT/Extract, Transform, Load, con funzionalità come parser di testo delimitato ottimizzati per le prestazioni.
Componenti dell’architettura di Azure Synapse SQL
Apache Spark per Azure Synapse
I pool di Apache Spark completano l’elenco delle opzioni di calcolo di Azure Synapse con un potente motore MPP progettato per l’elaborazione in memoria dei Big Data, ideale per carichi di lavoro semi-strutturati o non strutturati, tipici dei casi d’uso dell’Internet delle cose (IoT) e del machine learning.
L’implementazione di Synapse è nativamente disponibile dall’hub Develop, dove è possibile creare direttamente Notebook utilizzando un editor avanzato. Anche i servizi cognitivi e il machine learning sono integrati nativamente. Con un clic destro nell’hub Data è possibile creare Notebook iniziali che utilizzano questi servizi.
IntelliSense è integrato in tutti gli editor e si possono utilizzare più linguaggi all’interno dello stesso Notebook, tra cui Python (PySpark), C#, Scala o Spark SQL.
Analisi dei Big Data con Azure Synapse
Azure Synapse Analytics: vantaggi e casi d’uso
Adesso che abbiamo capito in linea generale le sue caratteristiche è ora di passare ai vantaggi pratici. L’uso di Azure Synapse Analytics di Microsoft Azure come strumento di analisi Big Data basato sul cloud può offrire enormi benefici per il proprio business nel breve e nel lungo periodo.
Nell’elenco qui sotto ve ne proponiamo alcuni tra i più rilevanti.
Piattaforma dati unificata
Synapse Analytics riunisce il meglio dei servizi dati di Azure e di altri servizi, garantendo che funzionino insieme senza problemi per fornire una piattaforma unificata di analisi dei dati che possa soddisfare le esigenze della propria organizzazione. Questi servizi includono Azure Data Warehouse, Azure Data Lake, Azure Active Directory, Azure Data Factory, Apache Spark e Microsoft Power BI.
Con questa piattaforma è possibile utilizzare un’unica interfaccia utente web-based (UT) per svolgere varie attività sui dati, come l’esplorazione dei dati, l’esecuzione di esperimenti e lo sviluppo di pipeline di dati che garantiscono un flusso ininterrotto di dati per generare insight aziendali utili.
Integrazione con il machine learning
Synapse Analytics offre funzionalità di Machine Learning (ML) che è possibile applicare a diversi scopi. Il più comune è l’applicazione di algoritmi ML per facilitare l’acquisizione e la comprensione dei dati. Si può utilizzare Azure Data Factory per creare pipeline di dati che trasformano i dati aziendali in un formato consumabile per il ML e generare insight da quei dati tramite report preparati con Apache Spark o pool SQL serverless.
Si possono anche addestrare modelli ML utilizzando sia Apache Spark Pools che Azure Machine Learning Automated ML e questi modelli ML possono poi essere distribuiti per generare previsioni all’interno del data warehouse stesso.
Sicurezza integrata
Azure Synapse Analytics offre una serie di funzionalità di sicurezza ed è conforme a quasi 30 regolamenti di conformità leader del settore, come l’Organizzazione Internazionale per la Standardizzazione (ISO), i Controlli di Sistema e Organizzazione (SOC) e l’Health Insurance Portability and Accountability Act (HIPAA), tra gli altri. Supporta l’Active Directory di Azure (AD), l’autenticazione basata su SQL e l’autenticazione a più fattori.
Inoltre, supporta la crittografia dei dati a riposo e in transito, nonché la classificazione dei dati sensibili. Azure Synapse Analytics supporta anche la sicurezza a livello di riga, colonna e oggetto con mascheramento dinamico dei dati, nonché la sicurezza a livello di rete con reti virtuali e firewall. Questo garantisce che, quando i propri dati aziendali sensibili vengono elaborati tramite Synapse Analytics saranno protetti con il massimo livello di sicurezza.
Proteggere la privacy e la sicurezza dei dati con Azure Synapse Analytics
Integrazione con Power BI
Azure Synapse Analytics si integra direttamente con Microsoft Power BI, che offre dashboard e visualizzazioni con un robusto set di funzionalità analitiche e di reportistica. Utilizzando Synapse Studio, i data analyst potranno facilmente analizzare i dati e generare dashboard che forniscono insight aziendali utili.
Approccio low-code
Azure Synapse Analytics offre numerosi vantaggi ai data engineer, semplificando e accelerando lo sviluppo e la gestione delle soluzioni di data warehousing e analytics. Grazie a strumenti visivi e interfacce drag-and-drop, i data engineer possono progettare e implementare flussi di lavoro complessi senza la necessità di scrivere codice dettagliato, riducendo il tempo di sviluppo e minimizzando gli errori.
Casi d’uso comuni di Azure Synapse Analytics
In virtù delle sue funzionalità, Azure Synapse Analytics può essere utilizzato in un’ampia varietà di scenari che richiedono la rapida e precisa elaborazione dei dati che si producono. Vediamone alcuni dei più comuni e importanti qui sotto per farci un’idea ancora più chiara della versatilità e utilità del servizio in contesti reali.
Previsione delle tendenze
Una delle applicazioni più significative di Azure Synapse Analytics risiede nella sua capacità di centralizzare i dati provenienti da vari canali di vendita per i rivenditori.
Grazie al servizio, i rivenditori possono integrare senza problemi i dati da diverse fonti, eliminando i silos di dati e consentendo una visione completa delle loro operazioni aziendali. Nel frattempo, lo strumento può anche aiutare a pulire, elaborare ed esaminare questi dati consolidati.
Integrazione omnichannel e analisi dei dati
Offrendo un approccio unificato alla gestione dei dati, Microsoft Azure Synapse Analytics permette ai rivenditori di ottenere insights più precisi e azionabili dai dati. Ad esempio, analizzando gli acquisti passati dei clienti, le abitudini di navigazione e le preferenze, i rivenditori possono comprendere meglio il loro pubblico target.
Questo aiuta i rivenditori a creare servizi su misura e migliorare la rilevanza degli sforzi di marketing e delle offerte. Il risultato è una strategia aziendale e un’esperienza cliente migliorate che favoriscono la fedeltà, incoraggiano gli acquisti ripetuti e promuovono la crescita a lungo termine per l’attività di vendita al dettaglio.
Miglioramento della visibilità e del monitoraggio delle prestazioni
Migliorare il processo di monitoraggio delle prestazioni è un altro caso d’uso altamente impattante per Azure Synapse Analytics. Con la capacità di fornire agli utenti visibilità in tempo reale sui livelli di inventario e le tendenze di vendita, questa potente piattaforma di analisi consente la condivisione di dati accurati che aiutano i produttori a stabilire una collaborazione efficace con i loro clienti.
Questa maggiore trasparenza e accuratezza dei dati consente ai produttori di prendere decisioni ben informate riguardo alla produzione, al rifornimento e alla logistica. Nel frattempo, i clienti possono beneficiare delle previsioni di domanda migliorate del produttore per minimizzare i casi di esaurimento scorte e le opportunità di business perse.
Sul fronte della catena di approvvigionamento, Azure Synapse Analytics offre ai fornitori capacità di analisi avanzate che permettono loro di ottenere insights più profondi sulle prestazioni della loro catena di approvvigionamento. Analizzando punti dati critici come i tempi di consegna e l’evasione degli ordini, i produttori possono identificare potenziali aree di miglioramento e implementare strategie mirate per ottimizzare le loro operazioni della catena di approvvigionamento.
Questa ottimizzazione della catena di approvvigionamento permette ai produttori di essere più competitivi sul mercato, rispondendo rapidamente alle esigenze in cambiamento e offrendo un servizio clienti superiore.
Rilevamento delle frodi
Microsoft Azure Synapse Analytics eccelle nella sua capacità di assistere gli utenti nel rilevamento delle frodi, rendendolo uno strumento prezioso per le istituzioni finanziarie. Con il suo robusto set di strumenti e capacità, Azure Synapse Analytics consente agli utenti di analizzare efficacemente vasti volumi di dati e applicare algoritmi avanzati di rilevamento delle frodi, risultando in insights azionabili.
Una delle caratteristiche distintive di Azure Synapse Analytics è il suo supporto per il monitoraggio continuo dell’attività transazionale su conti e dispositivi in tempo reale. Questa capacità di monitoraggio in tempo reale permette agli utenti di identificare rapidamente qualsiasi comportamento sospetto o fraudolento, consentendo loro di prendere immediate azioni mitigative.
In questo modo, le istituzioni finanziarie possono minimizzare il rischio di perdite finanziarie e salvaguardare la loro reputazione, ottenendo allo stesso tempo l’assistenza necessaria per soddisfare i requisiti di conformità normativa e implementare pratiche di governance efficaci.
Azure Synapse Analytics vs. Azure Data Factory
La presenza di numerosi servizi dedicati alla gestione e all’analisi dei dati all’interno dell’offerta di Microsoft Azure può generare un po’ di confusione negli utenti che si stanno avvicinando per la prima volta alla piattaforma di cloud computing della casa di Redmond.
Azure Synapse e Azure Data Factory sono entrambi componenti essenziali delle offerte di integrazione e analisi dei dati di Microsoft, ma servono scopi diversi e si rivolgono a casi d’uso distinti.
Synapse è un servizio di analisi completo che combina big data e data warehousing. Offre ampie capacità di elaborazione dei dati, supporta vari linguaggi di programmazione (come SQL, Python e Spark) e si integra profondamente con strumenti di machine learning e piattaforme di business intelligence come Power BI. Questo lo rende adatto per analisi avanzate, trasformazioni dei dati in tempo reale e necessità di data warehousing su larga scala.
Azure Data Factory è invece un servizio di integrazione dei dati focalizzato sui processi ETL (estrazione, trasformazione, caricamento). Consente la creazione di pipeline di dati attraverso un’interfaccia grafica, supportando varie fonti e destinazioni di dati. Si concentra principalmente su soluzioni senza codice per la trasformazione e l’integrazione delle informazioni; tuttavia, non offre la stessa ampiezza di capacità analitiche o flessibilità di programmazione di Azure Synapse.
Entrambi i servizi facilitano l’integrazione e la trasformazione dei dati ma Azure Synapse fornisce una piattaforma più robusta per l’analisi completa e il data warehousing, sfruttando vari ambienti di programmazione e un’integrazione più profonda con il machine learning mentre Azure Data Factory, invece, è progettato per l’orchestrazione delle pipeline di dati e operazioni ETL semplici e scalabili.
Se si desidera solo connettere e trasformare i dati senza scrivere codice, si dovrebbe optare per Azure Data Factory. Tuttavia, non consente di personalizzare le pipeline di dati oltre le sue capacità senza codice. Nel caso in cui si stesse invece cercando una maggiore flessibilità e controllo, Azure Synapse è la scelta migliore.
Architettura BI automatizzata basata su Azure Synapse e Azure Data Factory
Azure Synapse Analytics Pricing: costi e ottimizzazione
Azure Synapse offre diversi modelli di pricing per adattarsi alle diverse esigenze delle aziende.
Il modello “Pay-as-you-go” è ideale per aziende con carichi di lavoro variabili o imprevedibili. Con questo modello, le aziende pagano solo per le risorse effettivamente utilizzate, senza impegni a lungo termine. Questo approccio permette di adattare dinamicamente la potenza di calcolo e lo storage in base alle necessità reali, riducendo così gli sprechi di risorse e i costi inutili.
Il modello “Serverless” è invece progettato per carichi di lavoro sporadici o imprevedibili, dove non è necessario mantenere un’infrastruttura costantemente attiva. Con il modello serverless, le aziende pagano solo per le query eseguite, basandosi sulla quantità di dati elaborati. Questo approccio è particolarmente vantaggioso per scenari di analisi ad hoc, dove le richieste di calcolo possono variare significativamente.
Infine, il modello “Reserved Capacity” è pensato per aziende con carichi di lavoro prevedibili e costanti che necessitano di analisi regolari. Sottoscrivendo una capacità riservata per un periodo di uno o tre anni, le aziende possono beneficiare di sconti significativi rispetto al modello “Pay-as-you-go”. Questo modello offre una gestione dei costi più prevedibile e consente di pianificare meglio il budget IT.
Per quanto riguarda le variabili, ci sono diversi fattori da tenere in considerazione che possono influire in maniera sostanziale sul costo del servizio, come lo storage, il trasferimento dei dati, i backup e il monitoraggio.
Il calcolo (in sostanza la potenza di elaborazione), è addebitato in base alle DWU. Più alta è la quantità di DWU allocata, maggiore sarà la potenza di calcolo e, di conseguenza, i costi. Il calcolo viene addebitato su base oraria, il che significa che si paga solo per le ore in cui il data warehouse è attivo.
Per quanto riguarda lo storage, i costi sono legati al volume dei dati memorizzati e alla loro replicazione. Azure Synapse addebita lo storage in base al volume totale dei dati, arrotondato al terabyte più vicino. Questo include non solo i dati primari ma anche sette giorni di snapshot incrementali.
Il trasferimento dei dati comporta costi sia per l’ingresso (ingress) che per l’uscita (egress). I costi di ingresso sono generalmente gratuiti, ma l’uscita, specialmente se tra regioni diverse, può diventare costosa.
Le operazioni di backup e ripristino hanno costi variabili in base alla frequenza e alla durata dei backup che si decide di effettuare. Maggiore è la frequenza e più lungo è il periodo di conservazione dei backup, maggiori saranno i costi associati.
Per informazioni più dettagliate sui prezzi Microsoft mette a disposizione un comodo strumento di calcolo (disponibile qui), che permette di calcolare le opzioni di pricing in base a regione geografica, valuta, tipologia di servizio e tempo di impiego (calcolabile in ore o mesi).
Ottimizzare i costi di Azure Synapse Analytics
Vista la quantità di variabili che possono influire sul prezzo, è importante per le aziende adottare strategie per ottimizzare l’utilizzo delle risorse messe a disposizione dal servizio e ridurre la spesa per le proprie operazioni.
Una delle tecniche più efficaci è utilizzare le funzionalità di pausa e ripresa, che consentono di interrompere temporaneamente l’attività del data warehouse quando non è in uso, risparmiando sui costi di calcolo. Si può impostare uno schedule automatico che metta in pausa il data warehouse durante le ore non lavorative e lo riattivi durante gli orari di picco.
Ridimensionare le risorse in base ai carichi di lavoro è un’altra tecnica estremamente utile, aumentando la capacità di calcolo durante i periodi di elevata attività e ridurla durante i periodi di bassa attività. Azure Synapse consente di scalare le Data Warehouse Units (DWU) in modo dinamico, permettendo di adattare le risorse alle necessità del momento.
Anche l’utilizzo di tecniche di compressione dei dati avanzate è un ulteriore metodo di ottimizzazione delle risorse che può ridurre significativamente lo spazio necessario per archiviare i dati e, di conseguenza, far risparmiare notevoli quantità di denaro.
Infine, strumenti integrati come Azure Synapse Studio e Azure Cost Management and Billing forniscono una panoramica dettagliata delle prestazioni delle query e dei costi associati. Il primo offre funzionalità di monitoraggio in tempo reale che permettono di osservare l’uso delle risorse e le prestazioni delle query. Il secondo consente di monitorare e gestire le spese, identificando aree di overspending e fornendo raccomandazioni per migliorare il rapporto costo/efficienza.
Come configurare Azure Synapse Analytics
Configurare Azure Synapse Analytics è un processo semplice che può essere completato in pochi clic. Per dimostrarlo, vi proponiamo in questa sezione un piccolo esempio con pochi semplici passaggi che potete effettuare per sperimentare creando una nuova risorsa, rendendola operativa in pochissimo tempo.
1. Accesso al portale Azure e creazione risorsa
Il primo passo è navigare nel portale di Azure e accedere con le proprie credenziali dell’account Azure. Una volta effettuato l’accesso, verrà mostrata questa pagina:
Home del portale AzureFacciamo clic sul pulsante + Create new resourcesituato sul lato sinistro dello schermo. Questo aprirà il menuCreate a resource. Sotto la barra di ricerca digitiamo synapse e, dalle opzioni, facciamo clic su Azure Synapse Analytics.
Pagina creazione nuove risorse, selezione di Azure Synapse Analytics dalla barra di ricercaFacciamo poi clic sul pulsante Create nella pagina che si apre.
Dettaglio della pagina di ASA e del pulsante Create
2. Configurare la risorsa
Una volta premuto su Create, questo aprirà il menù dove dovremo specificare i dettagli per configurare Azure Synapse Analytics. Per prima cosa dovremo selezionare l’abbonamento che desideriamo utilizzare. Dopodiché, dovremo scegliere il resource group nel quale desideriamo distribuire il nostro servizio.
Se non si ha un resource group, se ne può creare uno facendo clic su Create new. In questo tutorial, abbiamo specificatod4ssynapserg come nome del gruppo di risorse, ma potete scegliere un qualsiasi altro nome per esso a patto che sia univoco.
Creazione di un nuovo Resource GroupIl passo successivo è specificare il nome per il proprio workspace. In questo caso abbiamo specificato d4ssynapsewscome nome ma, di nuovo, potete scegliere un qualsiasi altro nome finché esso sia univoco. Per quanto riguarda la Regione qui abbiamo specificatoWest Europe, ma si può tranquillamente scegliere la regione più vicina a sé.
Sotto Select Data Lake Storage Gen 2, nelle sezioniAccount NameeFile system name, fornisci di nuovo un nome univoco in entrambi.
In questo particolare caso abbiamo specificato come nome d4ssynapsedatagenper il nome dell’account ed4ssynapsefn come nome del file system.
Dettaglio creazione di un nuovo workspaceMantieniamo l’opzione predefinita per Assegnare a me il ruolo di Storage Blob Data Contributorsul box dell’accountData Lake Storage Gen2, e fai clic suReview + Create.
Dettaglio box spuntatoQuesto aprirà una pagina dove vedremo il messaggio “Validation Succeeded”, rivedere le nostre configurazioni e tornare indietro per modificarle, se necessario. È possibile anche vedere il costo stimato per mese nella valuta scelta per il pagamento.
Messaggio di validazione e sintesi delle informazioni
3. Distribuzione, gestione ed eliminazione
Una volta soddisfatti delle configurazioni sopra, dovremo semplicemente fare clic sul pulsante Create per distribuire il nostro database. La distribuzione può richiedere alcuni minuti e il pannello di distribuzione mostrerà lo stato.
Schermata del pannello di deployment della risorsaFacciamo clic su Go to resource group per aprire la pagina seguente, dove potremo visualizzare informazioni sul resource groupe di Synapse Analytics che abbiamo appena creato, come il workspace di e l’account di storage associati.
Ora possiamo aprire Synapse Studio facendo clic sul workspace di Synapse e poi selezionando Opennella casellaOpen Synapse Studio.
Completando i passaggi sopra, si aprirà Synapse Analytics Studio, come mostrato qui sotto. Sul lato sinistro, puoi esplorare le schede per Data, Develop, Integrate, MonitoreManage.
Schermata principale di Synapse Studio
Conclusioni
La capacità di analizzare tutti i dati generati dai propri processi aziendali e di generare insight utili per migliorare le decisioni strategiche della propria compagnia è ormai fondamentale nel panorama contemporaneo. Ma con un volume così grande di dati generati ogni giorno, tutti memorizzati in vari data warehouse e data lake scollegati tra di loro, sfruttare effettivamente i propri dati è più facile a dirsi che a farsi.
Azure Synapse Analytics si propone come una solida risposta a tutte queste problematiche, offrendo una piattaforma di analisi dei dati che unifica tutti i dati memorizzati nei sistemi della propria azienda e fornisce un’interfaccia utente unica e intuitiva, ben adatta a qualsiasi data scientist che desidera concentrarsi sulla creazione di modelli e insight sui dati, senza doversi preoccupare dell’infrastruttura.
È facile da configurare, facile da usare e può generare buoni modelli che possono essere immediatamente utilizzati, con un perfetto bilanciamento tra rapidità, efficienza e precisione. Perché non provarlo, quindi e vedere se è la risposta anche alle vostre esigenze?
Leggi il caso di successo: Azure Synapse Analytics per la Sanità: monitoraggio avanzato di prestazioni cliniche e amministrative
FAQ su Azure Synapse Analytics
Cos’è Azure Synapse Analytics?Azure Synapse Analytics è un servizio di analisi dei dati che integra l’elaborazione di big data, data warehousing e integrazione dei dati su un’unica piattaforma. Consente di interrogare sia dati relazionali che non relazionali utilizzando risorse serverless o dedicate.
Come gestisce i big data Azure Synapse Analytics?Azure Synapse Analytics integra dati da diverse fonti come data lake e warehouse, offrendo query serverless on-demand e risorse dedicate. Facilita l’analisi dei big data combinando servizi come Apache Spark e Azure Data Factory.
Quali sono i vantaggi di Azure Synapse Analytics?Azure Synapse Analytics offre una gestione centralizzata dei dati, prestazioni potenziate grazie all’elaborazione parallela e integrazione con strumenti come Power BI e Azure Machine Learning. Fornisce anche funzionalità di sicurezza avanzate e gestione dei costi con un modello di pricing basato sul consumo.
Come supporta il machine learning Azure Synapse Analytics?Azure Synapse Analytics si integra con Azure Machine Learning e Apache Spark, permettendo agli utenti di addestrare e applicare modelli di machine learning direttamente sulla piattaforma.
Quali sono i casi d’uso comuni per Azure Synapse Analytics?Azure Synapse Analytics è ampiamente utilizzato per la previsione di tendenze, l’integrazione di dati omnichannel, l’ottimizzazione della supply chain e il rilevamento delle frodi.
Come garantisce la sicurezza Azure Synapse Analytics?Azure Synapse Analytics offre una sicurezza avanzata con funzionalità come crittografia, autenticazione a più fattori, controllo degli accessi basato sui ruoli e conformità con regolamenti importanti come HIPAA e ISO.
Quali linguaggi supporta Azure Synapse Analytics?Azure Synapse Analytics supporta diversi linguaggi di programmazione, tra cui T-SQL, Python, Scala, Spark SQL e .Net, offrendo flessibilità nella query e nella manipolazione dei dati.
Come può Azure Synapse Analytics integrarsi con Power BI?Azure Synapse Analytics si integra perfettamente con Power BI, consentendo la visualizzazione dei dati e la creazione di dashboard direttamente all’interno di Synapse Studio.
Come viene calcolato il prezzo di Azure Synapse Analytics?Azure Synapse Analytics segue un modello di prezzo basato sul consumo per le query SQL serverless, in cui gli utenti pagano solo per i dati elaborati. Le risorse dedicate, come i pool SQL, vengono tariffate in base alle prestazioni e possono essere scalate o messe in pausa per controllare i costi.
Come si configura Azure Synapse Analytics?La configurazione di Azure Synapse Analytics è semplice attraverso il portale Azure. Gli utenti devono creare una risorsa, configurare il gruppo di risorse, selezionare l’archiviazione e distribuire lo spazio di lavoro Synapse. Synapse Studio viene poi utilizzato per la gestione dei dati e l’analisi.
Scritto da
Emanuele Rossi
Infra & Security · Dev4Side
Dev4Side Software · Microsoft Gold Partner
Hai bisogno di implementare questo nella tua azienda?
I nostri team specializzati hanno completato oltre 200 implementazioni Microsoft in tutta Italia. Contattaci per una valutazione gratuita e senza impegno del tuo progetto.
Articoli correlati
Microsoft Azure spiegato semplice: cos'è e quali servizi offre
Microsoft Azure è la piattaforma cloud per infrastruttura, app e intelligenza artificiale. Scopri i servizi principali, il pricing e i vantaggi per le aziende.
Azure Security Consulting: consulenza per la sicurezza cloud
Azure Security Consulting: proteggi il cloud aziendale con un partner certificato Microsoft. Perché serve, cosa include e come scegliere il consulente giusto.
Azure DevOps Consulting: cos’è e cosa offre al proprio business
Azure DevOps Consulting: perché affidarsi a un partner certificato per pipeline CI/CD e DevOps. Vantaggi, criteri di scelta e cosa aspettarsi dalla consulenza.