Stiamo lavorando per ripristinare l'app di Unionpedia nel Google Play Store
UscenteArrivo
🌟Abbiamo semplificato il nostro design per una migliore navigazione!
Instagram Facebook X LinkedIn
La tua Unionpedia con il tuo logo e dominio, a partire da 9,99 USD/mese
Crea il mio Unionpedia

Overfitting

Indice Overfitting

In statistica e in informatica, si parla di overfitting o sovradattamento (oppure adattamento eccessivo) quando un modello statistico molto complesso si adatta ai dati osservati (il campione) perché ha un numero eccessivo di parametri rispetto al numero di osservazioni.

Indice

  1. 21 relazioni: Adversarial machine learning, Algoritmo ID3, Apprendimento automatico, Apprendimento federato, Compromesso bias-varianza, Convalida incrociata, Criterio di informazione Bayesiano, Data mining, Fattore di Bayes, Foresta casuale, Incorporamento del grafo di conoscenza, Matrix factorization, Minima lunghezza di descrizione, Modello lineare generalizzato, Problema inverso, Regolarizzazione, Regolarizzazione (matematica), Selezione delle caratteristiche, Stima kernel di densità, Teoria dell'apprendimento statistico, Training e test set.

Adversarial machine learning

Adversarial machine learning (Apprendimento automatico antagonistico) è una serie di tecniche volte a compromettere il corretto funzionamento di un sistema informatico che faccia uso di algoritmi di apprendimento automatico, tramite la costruzione di input speciali in grado di ingannare tali algoritmi: più nello specifico, lo scopo di tali tecniche è quello di causare la classificazione errata in uno di questi algoritmi.

Vedere Overfitting e Adversarial machine learning

Algoritmo ID3

ID3 (Iterative Dichotomiser 3) è un algoritmo greedy per l'induzione di alberi di decisione.

Vedere Overfitting e Algoritmo ID3

Apprendimento automatico

Lapprendimento automatico (abbreviato in ML) è una branca dell'intelligenza artificiale che raccoglie metodi sviluppati negli ultimi decenni del XX secolo in varie comunità scientifiche, sotto diversi nomi quali: statistica computazionale, riconoscimento di pattern, reti neurali artificiali, filtraggio adattivo, teoria dei sistemi dinamici, elaborazione delle immagini, data mining, algoritmi adattivi, ecc; che utilizza metodi statistici per migliorare la performance di un algoritmo nell'identificare pattern nei dati.

Vedere Overfitting e Apprendimento automatico

Apprendimento federato

Lapprendimento federato è una tecnica di apprendimento automatico che permette di addestrare un algoritmo attraverso l'utilizzo di dispositivi decentralizzati o server che mantengono i dati, senza la necessità di scambiare i dati stessi.

Vedere Overfitting e Apprendimento federato

Compromesso bias-varianza

Nella statistica e nell'apprendimento automatico, il compromesso bias-varianza è la proprietà di un modello secondo cui la varianza del parametro stimato tra i campioni può essere ridotta aumentando il bias nei parametri stimati.

Vedere Overfitting e Compromesso bias-varianza

Convalida incrociata

La convalida incrociata (cross-validation in inglese) è una tecnica statistica utilizzabile in presenza di una buona numerosità del campione osservato.

Vedere Overfitting e Convalida incrociata

Criterio di informazione Bayesiano

Per la statistica, il Criterio di informazione Bayesiano (Bayesian information criterion, BIC) o Criterio di Schwarz (indicato anche come SBC, SBIC) è un criterio per la selezione di un modello tra una classe di modelli parametrici con un diverso numero di parametri.

Vedere Overfitting e Criterio di informazione Bayesiano

Data mining

Lestrazione di dati o data mining è l'insieme di tecniche e metodologie che hanno per oggetto l'estrazione di informazioni utili da grandi quantità di dati (es. banche dati, data warehouse, ecc.), attraverso metodi automatici o semi-automatici (es. apprendimento automatico) e l'utilizzo scientifico, aziendale, industriale o operativo delle stesse.

Vedere Overfitting e Data mining

Fattore di Bayes

In statistica l'impiego del fattore di Bayes è un'alternativa bayesiana al classico test di verifica d'ipotesi. Il confronto bayesiano di modelli è un metodo di scelta di modello basato su fattori di Bayes.

Vedere Overfitting e Fattore di Bayes

Foresta casuale

Una foresta casuale è un classificatore d'insieme ottenuto dall'aggregazione tramite bagging di alberi di decisione L'algoritmo per la creazione di una foresta casuale fu sviluppato originariamente da Leo Breiman e Adele Cutler.

Vedere Overfitting e Foresta casuale

Incorporamento del grafo di conoscenza

Nella disciplina dell'apprendimento delle relazioni, l'incorporamento del grafo di conoscenza, o knowledge graph embedding (KGE) in inglese, anche riferito con il nome di knowledge representation learning (KRL), o apprendimento multi relazionale è un campo dell'apprendimento automatico che si occupa di apprendere una rappresentazione a bassa dimensionalità delle entità e relazioni che costituiscono un grafo della conoscenza o anche detto knowledge graph, cercando di preservare il loro significato semantico.

Vedere Overfitting e Incorporamento del grafo di conoscenza

Matrix factorization

La Matrix factorization (MF), o fattorizzazione di matrice, è una classe di algoritmi collaborative filtering usata nei sistemi di raccomandazione.

Vedere Overfitting e Matrix factorization

Minima lunghezza di descrizione

Il principio della minima lunghezza di descrizione (MLD) è una formalizzazione del Rasoio di Occam nella quale la migliore ipotesi per un determinato insieme di dati è quella che conduce alla migliore compressione dei dati.

Vedere Overfitting e Minima lunghezza di descrizione

Modello lineare generalizzato

I modelli lineari generalizzati (GLM) sono una generalizzazione del più classico modello lineare nell'ambito della regressione lineare. Mentre nel modello lineare classico si ipotizza che la variabile endogena sia distribuita in modo normale, nell'ambito dei modelli lineari generalizzati la variabile endogena può essere distribuita come una qualsiasi variabile casuale della famiglia esponenziale e dunque, oltre alla variabile casuale normale, entrano in gioco anche altre variabili casuali, quali la binomiale, la poissoniana, la gamma, la normale inversa e altre.

Vedere Overfitting e Modello lineare generalizzato

Problema inverso

Un problema inverso è un contesto di indagine generico in cui vengono ricercate informazioni su una grandezza fisica, o più in generale su di un sistema, a partire da misurazioni o informazioni di tipo indiretto.

Vedere Overfitting e Problema inverso

Regolarizzazione

*Regolarizzazione – serie di metodi per ridurre l'overfitting.

Vedere Overfitting e Regolarizzazione

Regolarizzazione (matematica)

In matematica e statistica, particolarmente nei campi dell'apprendimento automatico e dei problemi inversi, la regolarizzazione implica l'introduzione di ulteriore informazione allo scopo di risolvere un problema mal condizionato o per prevenire l'eccessivo adattamento.

Vedere Overfitting e Regolarizzazione (matematica)

Selezione delle caratteristiche

Nel riconoscimento di pattern e nell'elaborazione delle immagini la selezione delle caratteristiche è una forma speciale di riduzione della dimensionalità di un determinato dataset.

Vedere Overfitting e Selezione delle caratteristiche

Stima kernel di densità

In statistica, la stima kernel di densità (o kernel density estimation) è un metodo non parametrico utilizzato per il riconoscimento di pattern e per la classificazione attraverso una stima di densità negli spazi metrici, o spazio delle feature.

Vedere Overfitting e Stima kernel di densità

Teoria dell'apprendimento statistico

La teoria dell'apprendimento statistico è il fondamento teorico su cui si basa l'apprendimento automatico. Attingendo ai campi della statistica e dell'analisi funzionale, la teoria dell'apprendimento statistico cerca di risolvere il generico problema di trovare una funzione capace di effettuare previsioni basandosi sui dati.

Vedere Overfitting e Teoria dell'apprendimento statistico

Training e test set

Nell'apprendimento automatico un training set (in italiano insieme di addestramento o insieme di stima) è un insieme di esempi (spesso rappresentati come vettori di valori di attributi discreti o continui, le variabili di input) ad ognuno dei quali è associata una risposta, il valore di un attributo-obiettivo, ossia un valore categorico, cioè una classe, o un valore numerico.

Vedere Overfitting e Training e test set

Conosciuto come Eccessivo adattamento, Sovradattamento.