Che cosa è l'integrazione dei dati?

L'integrazione dei dati è la fusione di più origini dati in un'unica fonte di dati. Questa pratica è spesso molto tempo e coinvolti, come le diverse fonti di dati sono probabilmente incompatibili tra loro. Le cose semplici come diversi nomi di colonna in un foglio di calcolo sono sufficienti per richiedere la data riformattazione. Questo processo è più comune nelle situazioni in cui due gruppi iniziato senza connessione, ma sono messi insieme dopo aver lavorato in modo indipendente. L'integrazione dei dati è diventata un argomento più importante a causa della prevalenza di fonti di dati libere e basi dati online.

La parte di dati di integrazione di dati può essere quasi nulla fintanto che è memorizzato in un sistema informatico. Il contenuto effettivo dei dati è raramente importante quanto il modo in cui sono memorizzati i dati. La maggior parte del tempo, i dati sono conservati in banche dati, sistemi di informazione organizzato. Questi sistemi contengono voci e campi che permettono agli utenti di trovare rapidamente le informazioni uniche.

Il più grande ostacolo a qualsiasi processo di integrazione dei dati sono i dati in sé. In molti casi, quando i dati sono stati prima configurazione, non vi era alcuna intenzione di fondere il set di dati con un altro. Questo significa che anche se due set di dati possono riferirsi alla stessa cosa, sono totalmente incompatibili.

Quasi nulla farà database incompatibili. Qualcosa di semplice come una differenza nella presentazione, come ad esempio per campo o larghezza della colonna, può essere sufficiente a prevenire una facile fusione. Quando i dati è significativamente diverso, ad esempio un database che contiene informazioni più o meno, la fusione è molto più difficile.

Le due situazioni che richiedono l'integrazione dei dati più di ogni altro sono in campo di ricerca e imprese. Nel mondo degli affari, i reparti di fusione o società richiede che combina le informazioni precedentemente separato in un'unica struttura. Questa forma di integrazione è in generale molto difficile a meno che i gruppi originari utilizzati software simili e aveva obiettivi di informazioni simili.

Quando viene eseguita l'integrazione dei dati a scopo di ricerca, in genere va molto più agevole. Quando un ricercatore dà accesso alle sue informazioni ad un altro, le due parti sono generalmente esaminando lo stesso processo. Questo significa che useranno metodi simili per catalogare e archiviare i propri dati.

In passato, l'integrazione dei dati era una zona relativamente minore di studi dei dati, ma questo è cambiato da quando la prima parte del 21 ° secolo. Con database online gratuiti diventando sempre più popolare e preciso, le aziende stanno rimescolando per ottenere le loro informazioni in un formato condivisibile. Questo permette loro di rilasciare le loro informazioni sia in forma pubblica e di integrare le versioni private di noti interfacce pubbliche nei loro sistemi.

  • L'integrazione dei dati è la fusione di più origini dati in un'unica fonte di dati.