BigQuery Omni per l'analisi dei dati multi-cloud

Prova Il Nostro Strumento Per Eliminare I Problemi

BigQueryOmni è una nuova funzionalità da GoogleNuvola che permette di correre BigQuery query sui dati archiviati in più provider cloud e data center locali. Fornisce un'interfaccia SQL unificata e funzionalità di analisi best-in-class oltre ai dati archiviati AWS , Azzurro , on-premise e, naturalmente GoogleNuvola .

Interfaccia di analisi unificata

BigQueryOmni consente agli utenti di analizzare i dati su diversi data warehouse cloud, inclusi Amazon Redshift , Analisi delle sinapsi di Azure , Fiocco di neve su AWS e Azure e altre origini dati conformi a JDBC/ODBC utilizzando il familiare BigQuery Sintassi e funzioni SQL. Ciò fornisce un'unica interfaccia per interrogare e analizzare i dati indipendentemente da dove sono archiviati.

Vantaggi chiave

  • Interfaccia di analisi SQL unificata utilizzando BigQuery Dialetto SQL
  • Query federate su origini dati multi-cloud
  • Prestazioni migliori della categoria con BigQuery il motore di analisi accelerata di
  • Gestione unificata dell'identità e degli accessi tra origini dati
  • Esperienza integrata con gli altri GoogleNuvola servizi di analisi

Origini dati supportate

L'anteprima iniziale di BigQueryOmni supporta l'accesso federato alle seguenti origini dati:



  • Amazon Redshift
  • Analisi delle sinapsi di Azure
  • Fiocco di neve su AWS e Azure
  • Teradata
  • Databricks
  • Altre origini JDBC/ODBC
Fonte di dati Accesso alle query Streaming e replica
Amazon Redshift Futuro
Analisi delle sinapsi di Azure Futuro
Fiocco di neve su AWS/Azure Futuro

Come funziona BigQuery Omni

Sotto il cappuccio, BigQueryOmni sfrutta l'accesso federato alle query utilizzando interfacce standard come JDBC per eseguire query SQL sui dati presenti su altre piattaforme dati cloud. Ciò consente di accedere ai dati esterni tramite SQL senza dover spostare o replicare i dati all'interno BigQuery .

Architettura

Ad alto livello, il BigQueryOmni l'architettura assomiglia a:

  • I dati rimangono nei data warehouse cloud esistenti come Spostamento verso il rosso , Fiocco di neve , eccetera.
  • Per la connessione vengono utilizzate interfacce standard come JDBC/ODBC BigQuery a fonti esterne
  • BigQuery gestisce l'ottimizzazione, la pianificazione e l'esecuzione delle query sui dati presenti all'interno e all'esterno di Google Cloud.
  • I risultati vengono restituiti all'utente per l'analisi e la visualizzazione a valle.

Gestione dell'identità e degli accessi

Uno dei principali vantaggi di BigQueryOmni è la gestione unificata dell'identità e degli accessi tra diverse origini dati. Ciò consente governance, audit e controlli di accesso unificati. Nello specifico:

  • Gli utenti accedono ai dati tramite le proprie credenziali e identità Google Cloud.
  • I controlli di accesso a grana fine sono mappati su fonti esterne.
  • Tutta la cronologia delle query e i log di controllo sono disponibili in Google Cloud.

Casi d'uso

Ecco alcuni casi d'uso comuni per BigQueryOmni :

Analisi multi-cloud

Esegui query SQL federate e analisi sui dati archiviati in più cloud pubblici come AWS , Azzurro , E GoogleNuvola senza spostare alcun dato.

Migrazione al cloud

Utilizzo BigQueryOmni per interrogare e analizzare i dati ancora presenti Amazon Redshift , Fiocco di neve O Analisi delle sinapsi di Azure per aiutarti a pianificare e convalidare la tua migrazione a BigQuery . Non è necessario spostare i dati più volte.

BI ibrida e multi-cloud

Connetti strumenti di business intelligence come Looker, Tableau e Power BI ai dati presenti sul multi-cloud tramite BigQueryOmni invece di connettori e driver complessi.

Federazione e catalogo dei dati

Utilizzo BigQueryOmni come catalogo di dati multi-cloud che fornisce metadati, schemi e governance unificati coerenti in tutti gli ambienti di analisi.

Prezzi

BigQueryOmni è attualmente disponibile in anteprima senza costi aggiuntivi oltre a quelli già esistenti BigQuery prezzi. Fare riferimento a GoogleNuvola calcolatore dei prezzi per i dettagli.

Considerazioni chiave

  • Nessun addebito incrementale durante l'anteprima successiva BigQuery utilizzo oggi
  • Piccola tassa federale per le query che coinvolgono origini dati esterne
  • Nessun addebito per la replica dei dati o lo spostamento

In futuro, prevediamo una piccola 'tassa federativa' incrementale per le query che coinvolgono fonti di dati esterne BigQueryOmni per tenere conto di alcuni costi aggiuntivi di rete tra servizi.

Iniziare

Ecco come iniziare con l'anteprima di BigQueryOmni :

  1. Abilita il BigQueryOmni bandiere dentro Console Google Cloud
  2. Crea origini dati esterne per fare riferimento alle query
  3. Scrivere query SQL che fanno riferimento a fonti esterne
  4. Esegui query, analizza i risultati e monitora le prestazioni

Dai un'occhiata a BigQueryOmni documentazione per screenshot ed esempi di codice per iniziare.

Risorse addizionali

  • I post del blog sull'analisi multi-cloud
  • Ricerca di settore sulle tendenze di adozione del multi-cloud
  • Rapporti di analisti che confrontano le capacità dei data warehouse

Limitazioni

La versione di anteprima iniziale presenta alcune limitazioni di cui tenere presente:

  • Accesso in sola lettura a fonti esterne. Non scrive.
  • Limitato a origini dati selezionate (Redshift, Snowflake, Synapse)
  • Ancora nessuno streaming o replica di dati esterni.
  • Tassa federale per l'accesso ai dati esterni.

Si prevede che queste limitazioni verranno risolte nelle versioni future di quest'anno.

Il futuro è multi-cloud

Gli ambienti multi-cloud e ibridi stanno diventando la norma per l'analisi aziendale. BigQueryOmni rappresenta Quello di Google Cloud visione e roadmap per fornire analisi SQL unificate sui dati ovunque, sia all'interno di Google Cloud che di altri cloud.

Nel corso del tempo, aspettati integrazioni più profonde, origini dati aggiuntive, accesso in lettura-scrittura, funzionalità di streaming e replica tra i cloud basati su Quello di BigQuery funzionalità di analisi migliori della categoria.

Il futuro è multi-cloud e BigQueryOmni mira a fornire il ponte analitico tra ecosistemi di dati eterogenei.

Guarda Anche: