Entity linking

Nell'ambito dell'elaborazione del linguaggio naturale, l'entity linking, noto anche come named entity linking (NEL), named entity disambiguation (NED), named entity recognition e disambiguation (NERD) o named entity normalization (NEN)M.

Indice

37 relazioni: Algoritmo, Algoritmo di pattern matching su stringhe, Algoritmo greedy, Algoritmo HITS, Anafora (linguistica), Apprendimento supervisionato, Base di conoscenza, Chat bot, Corpus, Data mining, DBpedia, Disambiguazione, Elaborazione del linguaggio naturale, Et al., Falso positivo e falso negativo, George Washington, Grafo, Information retrieval, Linked data, Macchine a vettori di supporto, Motore di ricerca, PageRank, Polisemia, Query, Ricerca semantica, Sistema di raccomandazione, Stati Uniti d'America, Storia di Wikipedia, Tf-idf, Training e test set, Uniform Resource Identifier, Uniform Resource Locator, Washington, Wikidata, Wikipedia, Word embedding, Word2vec.

Algoritmo

In matematica e informatica un algoritmo è la specificazione di una sequenza finita di operazioni (dette anche istruzioni) che consente di risolvere tutti i quesiti di una stessa classe o di calcolare il risultato di un'espressione matematica.

Vedere Entity linking e Algoritmo

Algoritmo di pattern matching su stringhe

In Informatica gli algoritmi di pattern matching su stringhe, a volte chiamati algoritmi di confronto fra stringhe o algoritmi di ricerca di stringhe, sono una classe importante degli algoritmi sulle stringhe che provano a individuare una posizione all'interno di una stringa più grande o di un testo, in cui una o più stringhe solitamente più piccole (dette anche pattern) si trovano.

Vedere Entity linking e Algoritmo di pattern matching su stringhe

Algoritmo greedy

Un algoritmo greedy è un paradigma algoritmico in base al quale la ricerca di una soluzione ottimale avviene seguendo una strategia euristica di problem-solving in cui l'algoritmo, a ogni passaggio, opta per la soluzione ottimale a livello locale (come definita in precedenza dal programmatore).

Vedere Entity linking e Algoritmo greedy

Algoritmo HITS

Hyperlink-Induced Topic Search (HITS; conosciuta anche come hubs and authorities) è un algoritmo, sviluppato da Jon Kleinberg, di valutazione delle pagine web in funzione dei link.

Vedere Entity linking e Algoritmo HITS

Anafora (linguistica)

Lanafora è una delle più importanti funzioni di coesione linguistica dei testi.Lo Duca, cit., 2008, p. 181. Serve a mettere in opera dei legami tra porzioni di un testo più o meno vaste e più o meno distanti tra loro.

Vedere Entity linking e Anafora (linguistica)

Apprendimento supervisionato

Lapprendimento supervisionato è una tecnica di apprendimento automatico che mira a istruire un sistema informatico in modo da consentirgli di elaborare automaticamente previsioni sui valori di uscita di un sistema rispetto ad un input sulla base di una serie di esempi ideali, costituiti da coppie di input e di output, che gli vengono inizialmente forniti.

Vedere Entity linking e Apprendimento supervisionato

Base di conoscenza

Una base di conoscenza (individuata anche con il termine inglese knowledge base e con l'acronimo KB) è un tipo speciale di banca dati per la gestione della conoscenza per scopi aziendali, culturali o didattici.

Vedere Entity linking e Base di conoscenza

Chat bot

Un chat bot, noto anche come chatterbot o bot di conversazione, è un software progettato per simulare una conversazione con un essere umano.

Vedere Entity linking e Chat bot

Corpus

Un corpus è una collezione di testi selezionati e organizzati per facilitare le analisi linguistiche. L'idea di selezione può anche mancare: per corpus può intendersi anche una raccolta completa di testimonianze linguistiche riguardanti una certa materia, ad esempio: "corpus della lingua sannita".

Vedere Entity linking e Corpus

Data mining

Lestrazione di dati o data mining è l'insieme di tecniche e metodologie che hanno per oggetto l'estrazione di informazioni utili da grandi quantità di dati (es. banche dati, data warehouse, ecc.), attraverso metodi automatici o semi-automatici (es. apprendimento automatico) e l'utilizzo scientifico, aziendale, industriale o operativo delle stesse.

Vedere Entity linking e Data mining

DBpedia

DBpedia è un progetto nato nel 2007 con lo scopo di estrarre informazioni strutturate da Wikipedia e pubblicarle sul Web come Linked Open Data in formato RDF.

Vedere Entity linking e DBpedia

Disambiguazione

La disambiguazione (in inglese Word Sense Disambiguation o, abbreviato, WSD) è il processo con il quale si precisa il significato di una parola o di un insieme di parole (frase), che denota significati diversi a seconda dei contesti, per evitare che sia ambigua.

Vedere Entity linking e Disambiguazione

Elaborazione del linguaggio naturale

Lelaborazione del linguaggio naturale (NLP, da natural language processing) è una sottobranca di linguistica, informatica e intelligenza artificiale che tratta l'interazione tra i computer e il linguaggio umano, in particolare sul come programmare i computer per elaborare e analizzare grandi quantità di dati di linguaggio naturale.

Vedere Entity linking e Elaborazione del linguaggio naturale

Et al.

et al. è un’abbreviazione delle espressioni latine et alii ("e altri"), et aliae ("e altre"), et alia ("e altre cose", con alia neutro plurale), oppure et alibi ("e altrove").

Vedere Entity linking e Et al.

Falso positivo e falso negativo

In statistica il falso positivo, analogo allerrore di primo tipo, è il risultato di un test che porta erroneamente ad accettare l'ipotesi sulla quale esso è stato condotto.

Vedere Entity linking e Falso positivo e falso negativo

George Washington

Fu comandante in capo dell'Esercito continentale durante tutta la guerra d'indipendenza americana (1775-1783) e divenne in seguito il primo presidente degli Stati Uniti d'America (1789-1797).

Vedere Entity linking e George Washington

Grafo

I grafi sono strutture matematiche discrete che rivestono interesse sia per la matematica che per un'ampia gamma di campi applicativi. In ambito matematico il loro studio, la teoria dei grafi, costituisce un'importante parte della combinatoria; i grafi inoltre sono utilizzati in aree come topologia, teoria degli automi, funzioni speciali, geometria dei poliedri, algebre di Lie.

Vedere Entity linking e Grafo

Information retrieval

L'information retrieval (IR), talvolta, meno di frequente, reso in lingua italiana come reperimento dell'informazione, è l'insieme delle tecniche utilizzate per gestire la rappresentazione, la memorizzazione, l'organizzazione e l'accesso ad oggetti contenenti informazioni quali documenti, pagine web, cataloghi online e oggetti multimediali.

Vedere Entity linking e Information retrieval

Linked data

I linked data o dati collegati, in informatica, sono una modalità di pubblicazione di dati strutturati che consente di collegare i dati fra di loro.

Vedere Entity linking e Linked data

Macchine a vettori di supporto

Le macchine a vettori di supporto (SVM, dall'inglese support-vector machines) sono dei modelli di apprendimento supervisionato associati ad algoritmi di apprendimento per la regressione e la classificazione.

Vedere Entity linking e Macchine a vettori di supporto

Motore di ricerca

Nell'ambito delle tecnologie di Internet, un motore di ricerca è un sistema automatico che analizza un insieme di dati (spesso da esso stesso raccolti) e restituisce un indice dei contenuti disponibili.

Vedere Entity linking e Motore di ricerca

PageRank

Il PageRank è un algoritmo di analisi che assegna un peso numerico ad ogni elemento di un insieme di documenti connessi per mezzo di collegamenti ipertestuali, ad esempio l'insieme delle pagine nel World Wide Web, con lo scopo di quantificare l'importanza relativa all'interno dell'insieme stesso.

Vedere Entity linking e PageRank

Polisemia

In semantica, la polisemia (dal greco polysemos, "dai molti significati", da polys, "molteplice", e sema, "segno") è la proprietà che una parola ha di esprimere più significati.

Vedere Entity linking e Polisemia

Query

In informatica, una query o interrogazione è un comando scritto dall'utente per ricavare informazioni riguardanti il contenuto di una base di dati.

Vedere Entity linking e Query

Ricerca semantica

La ricerca semantica è un campo di ricerca che cerca di migliorare l'accuratezza della ricerca nei motori di ricerca web cercando di comprendere l'intento del ricercatore e il significato contestuale dei termini adoperati al fine di generare risultati più rilevanti.

Vedere Entity linking e Ricerca semantica

Sistema di raccomandazione

Un sistema di raccomandazione o motore di raccomandazione è un software di filtraggio dei contenuti che crea delle raccomandazioni personalizzate specifiche per l’utente così da aiutarlo nelle sue scelte.

Vedere Entity linking e Sistema di raccomandazione

Stati Uniti d'America

Gli Stati Uniti d'America (comunemente indicati come Stati Uniti, o anche solo United States; in sigla USA) sono una repubblica federale dell'America settentrionale composta da cinquanta Stati e un distretto federale.

Vedere Entity linking e Stati Uniti d'America

Storia di Wikipedia

Wikipedia è un'enciclopedia online a contenuto libero nata il 15 gennaio 2001. Tra i suoi principi essenziali figurano il "punto di vista neutrale" e il rispetto del copyright.

Vedere Entity linking e Storia di Wikipedia

Tf-idf

La funzione di peso tf-idf (term frequency–inverse document frequency) è una funzione utilizzata in information retrieval per misurare l'importanza di un termine rispetto ad un documento o ad una collezione di documenti.

Vedere Entity linking e Tf-idf

Training e test set

Nell'apprendimento automatico un training set (in italiano insieme di addestramento o insieme di stima) è un insieme di esempi (spesso rappresentati come vettori di valori di attributi discreti o continui, le variabili di input) ad ognuno dei quali è associata una risposta, il valore di un attributo-obiettivo, ossia un valore categorico, cioè una classe, o un valore numerico.

Vedere Entity linking e Training e test set

Uniform Resource Identifier

In informatica, lo Uniform Resource Identifier (in acronimo URI) è una sequenza di caratteri che identifica universalmente ed univocamente una risorsa.

Vedere Entity linking e Uniform Resource Identifier

Uniform Resource Locator

Lo Uniform Resource Locator, anche noto con la sigla URL, è una sequenza di caratteri che identifica univocamente l'indirizzo di una risorsa su una rete di computer, come ad esempio un documento, un'immagine, un video, tipicamente presente su un host server e resa accessibile a un client.

Vedere Entity linking e Uniform Resource Locator

Washington

Washington D.C. (AFI:; in inglese) formalmente Distretto di Columbia, nota anche come Washington o D.C., è la capitale degli Stati Uniti d'America, con una popolazione di abitanti (abitanti nell'area metropolitana).

Vedere Entity linking e Washington

Wikidata

Wikidata è una base di conoscenza online collaborativa, sostenuta e ospitata dalla Wikimedia Foundation, con lo scopo di fornire un archivio comune di supporto agli altri progetti di Wikimedia, consultabile e modificabile sia da utenti umani che da bot.

Vedere Entity linking e Wikidata

Wikipedia

Wikipedia (pronuncia: vedi sotto) è un'enciclopedia online a contenuto libero, collaborativa, plurilingue e gratuita, nata nel 2001, sostenuta e ospitata dalla Wikimedia Foundation, un'organizzazione non a scopo di lucro statunitense.

Vedere Entity linking e Wikipedia

Word embedding

Il word embedding (tradotto letteralmente immersione di parole) anche conosciuto come rappresentazione distribuita delle parole permette di memorizzare le informazioni sia semantiche che sintattiche delle parole partendo da un corpus non annotato e costruendo uno spazio vettoriale in cui i vettori delle parole sono più vicini se le parole occorrono negli stessi contesti linguistici, cioè se sono riconosciute come semanticamente più simili (secondo l'ipotesi della semantica distribuzionale).

Vedere Entity linking e Word embedding

Word2vec

Word2vec è un insieme di modelli che sono utilizzati per produrre word embedding, il cui pacchetto fu originariamente creato in C da Tomas Mikolov, poi implementato anche in Pythonhttp://radimrehurek.com/gensim/models/word2vec.html e Java.

Vedere Entity linking e Word2vec

Unionpedia è una mappa concettuale o rete semantica organizzata come un'enciclopedia o un dizionario. Esso fornisce una breve definizione di ogni concetto e le sue relazioni.

Si tratta di una mappa mentale in linea gigante che serve come base per gli schemi concettuali, immagini o sintesi sinaptica. E 'gratuito - liberi, liberi di usare e ogni elemento o documento può essere scaricato. E 'uno strumento, risorsa o di riferimento per lo studio, la ricerca, l'istruzione, la formazione o istruzione che gli insegnanti possono utilizzare, insegnanti, professori, educatori, alunni e studenti; o la scuola per il mondo accademico, a scuola, primaria, secondaria, di mezzo, università, laurea tecnica, college, università, laurea, master o dottorati; per documenti, relazioni, documenti, progetti, idee, documentazione, riassunti, sondaggi o tesi. Ecco la definizione, spiegazione, descrizione, o il significato di ogni significativo su cui avete bisogno di informazioni, e una lista o un elenco di concetti correlati come appare un glossario. Disponibile in italiano, inglese, spagnolo, portoghese, giapponese, cinese, francese, tedesco, polacco, olandese, russo, arabo, hindi, svedese, ucraino, ungherese, catalano, ceco, ebraico, danese, finlandese, indonesiano, norvegese, rumeno, turco, vietnamita, coreano, tailandese, greco, bulgaro, croato, slovacca, lituano, filippina, lettone, estone e sloveno. Altre lingue presto.

Le informazioni si basano su articoli di Wikipedia e altri progetti Wikimedia, e sono disponibili sotto la Licenza Creative Commons Attribuzione-Condividi allo stesso modo.

Unionpedia non è supportata o affiliata alla Wikimedia Foundation.

Google Play, Android e il logo di Google Play sono marchi di Google Inc.

Politica sulla riservatezza

In altre lingue

Entity linking

Indice