3 Maggio 2021 14:41

Estrazione dei dati

Che cos’è il data mining?

Il data mining è un processo utilizzato dalle aziende per trasformare i dati grezzi in informazioni utili. Utilizzando il software per cercare modelli in grandi batch di dati, le aziende possono saperne di più sui propri clienti per sviluppare strategie di marketing più efficaci, aumentare le vendite e ridurre i costi. Il data mining dipende da un’efficace raccolta dei datiimmagazzinamento e elaborazione del computer.



I processi di data mining vengono utilizzati per creare modelli di apprendimento automatico che alimentano applicazioni, tra cui la tecnologia dei motori di ricerca e i programmi di raccomandazione di siti Web.

Come funziona il data mining

Il data mining implica l’esplorazione e l’analisi di grandi blocchi di informazioni per raccogliere modelli e tendenze significativi. Può essere utilizzato in vari modi, come marketing di database, gestione del rischio di credito, rilevamento di frodi, filtro e-mail di spam o anche per discernere il sentimento o l’opinione degli utenti.

Il processo di data mining si suddivide in cinque passaggi. Innanzitutto, le organizzazioni raccolgono i dati e li caricano nei propri data warehouse. Successivamente, archiviano e gestiscono i dati, su server interni o sul cloud. Analisti aziendali, team di gestione e professionisti della tecnologia dell’informazione accedono ai dati e determinano come vogliono organizzarli. Quindi, il software applicativo ordina i dati in base ai risultati dell’utente e, infine, l’utente finale presenta i dati in un formato facile da condividere, come un grafico o una tabella.

Software di data warehousing e mining

I programmi di data mining analizzano le relazioni e gli schemi nei dati in base a ciò che gli utenti richiedono. Ad esempio, un’azienda può utilizzare il software di data mining per creare classi di informazioni. Per illustrare, immagina che un ristorante voglia utilizzare il data mining per determinare quando dovrebbe offrire alcune specialità. Esamina le informazioni raccolte e crea classi in base a quando i clienti visitano e a ciò che ordinano.

In altri casi, i data miner trovano gruppi di informazioni basati su relazioni logiche o esaminano associazioni e schemi sequenziali per trarre conclusioni sulle tendenze nel comportamento dei consumatori.

Lo stoccaggio è un aspetto importante del data mining. Lo stoccaggio è quando le aziende centralizzano i propri dati in un database o programma. Con un data warehouse, un’organizzazione può scorporare segmenti di dati affinché utenti specifici possano analizzarli e utilizzarli.

Tuttavia, in altri casi, gli analisti possono iniziare con i dati desiderati e creare un  data warehouse basato su tali specifiche. Indipendentemente da come le aziende e altre entità organizzano i propri dati, li utilizzano per supportare i processi decisionali della direzione.

Esempio di data mining

I negozi di alimentari sono noti utenti delle tecniche di data mining. Molti supermercati offrono carte fedeltà gratuite ai clienti che danno loro accesso a prezzi ridotti non disponibili ai non membri. Le carte consentono ai negozi di monitorare facilmente chi sta acquistando cosa, quando lo acquistano ea quale prezzo. Dopo aver analizzato i dati, i negozi possono quindi utilizzare questi dati per offrire ai clienti coupon mirati alle loro abitudini di acquisto e decidere quando mettere in vendita gli articoli o quando venderli a prezzo pieno.

Il data mining può essere motivo di preoccupazione quando un’azienda utilizza solo informazioni selezionate, che non sono rappresentative del gruppo campione complessivo, per dimostrare una certa ipotesi.

Punti chiave

  • Il data mining è il processo di analisi di una grande quantità di informazioni per discernere tendenze e modelli.
  • Il data mining può essere utilizzato dalle aziende per qualsiasi cosa, dall’apprendimento di ciò che i clienti sono interessati o desiderano acquistare al rilevamento delle frodi e al filtraggio dello spam.
  • I programmi di data mining suddividono i modelli e le connessioni nei dati in base alle informazioni richieste o fornite dagli utenti.