Indice
37 relazioni: Algoritmo, Algoritmo di pattern matching su stringhe, Algoritmo greedy, Algoritmo HITS, Anafora (linguistica), Apprendimento supervisionato, Base di conoscenza, Chat bot, Corpus, Data mining, DBpedia, Disambiguazione, Elaborazione del linguaggio naturale, Et al., Falso positivo e falso negativo, George Washington, Grafo, Information retrieval, Linked data, Macchine a vettori di supporto, Motore di ricerca, PageRank, Polisemia, Query, Ricerca semantica, Sistema di raccomandazione, Stati Uniti d'America, Storia di Wikipedia, Tf-idf, Training e test set, Uniform Resource Identifier, Uniform Resource Locator, Washington, Wikidata, Wikipedia, Word embedding, Word2vec.
Algoritmo
In matematica e informatica un algoritmo è la specificazione di una sequenza finita di operazioni (dette anche istruzioni) che consente di risolvere tutti i quesiti di una stessa classe o di calcolare il risultato di un'espressione matematica.
Vedere Entity linking e Algoritmo
Algoritmo di pattern matching su stringhe
In Informatica gli algoritmi di pattern matching su stringhe, a volte chiamati algoritmi di confronto fra stringhe o algoritmi di ricerca di stringhe, sono una classe importante degli algoritmi sulle stringhe che provano a individuare una posizione all'interno di una stringa più grande o di un testo, in cui una o più stringhe solitamente più piccole (dette anche pattern) si trovano.
Vedere Entity linking e Algoritmo di pattern matching su stringhe
Algoritmo greedy
Un algoritmo greedy è un paradigma algoritmico in base al quale la ricerca di una soluzione ottimale avviene seguendo una strategia euristica di problem-solving in cui l'algoritmo, a ogni passaggio, opta per la soluzione ottimale a livello locale (come definita in precedenza dal programmatore).
Vedere Entity linking e Algoritmo greedy
Algoritmo HITS
Hyperlink-Induced Topic Search (HITS; conosciuta anche come hubs and authorities) è un algoritmo, sviluppato da Jon Kleinberg, di valutazione delle pagine web in funzione dei link.
Vedere Entity linking e Algoritmo HITS
Anafora (linguistica)
Lanafora è una delle più importanti funzioni di coesione linguistica dei testi.Lo Duca, cit., 2008, p. 181. Serve a mettere in opera dei legami tra porzioni di un testo più o meno vaste e più o meno distanti tra loro.
Vedere Entity linking e Anafora (linguistica)
Apprendimento supervisionato
Lapprendimento supervisionato è una tecnica di apprendimento automatico che mira a istruire un sistema informatico in modo da consentirgli di elaborare automaticamente previsioni sui valori di uscita di un sistema rispetto ad un input sulla base di una serie di esempi ideali, costituiti da coppie di input e di output, che gli vengono inizialmente forniti.
Vedere Entity linking e Apprendimento supervisionato
Base di conoscenza
Una base di conoscenza (individuata anche con il termine inglese knowledge base e con l'acronimo KB) è un tipo speciale di banca dati per la gestione della conoscenza per scopi aziendali, culturali o didattici.
Vedere Entity linking e Base di conoscenza
Chat bot
Un chat bot, noto anche come chatterbot o bot di conversazione, è un software progettato per simulare una conversazione con un essere umano.
Vedere Entity linking e Chat bot
Corpus
Un corpus è una collezione di testi selezionati e organizzati per facilitare le analisi linguistiche. L'idea di selezione può anche mancare: per corpus può intendersi anche una raccolta completa di testimonianze linguistiche riguardanti una certa materia, ad esempio: "corpus della lingua sannita".
Vedere Entity linking e Corpus
Data mining
Lestrazione di dati o data mining è l'insieme di tecniche e metodologie che hanno per oggetto l'estrazione di informazioni utili da grandi quantità di dati (es. banche dati, data warehouse, ecc.), attraverso metodi automatici o semi-automatici (es. apprendimento automatico) e l'utilizzo scientifico, aziendale, industriale o operativo delle stesse.
Vedere Entity linking e Data mining
DBpedia
DBpedia è un progetto nato nel 2007 con lo scopo di estrarre informazioni strutturate da Wikipedia e pubblicarle sul Web come Linked Open Data in formato RDF.
Vedere Entity linking e DBpedia
Disambiguazione
La disambiguazione (in inglese Word Sense Disambiguation o, abbreviato, WSD) è il processo con il quale si precisa il significato di una parola o di un insieme di parole (frase), che denota significati diversi a seconda dei contesti, per evitare che sia ambigua.
Vedere Entity linking e Disambiguazione
Elaborazione del linguaggio naturale
Lelaborazione del linguaggio naturale (NLP, da natural language processing) è una sottobranca di linguistica, informatica e intelligenza artificiale che tratta l'interazione tra i computer e il linguaggio umano, in particolare sul come programmare i computer per elaborare e analizzare grandi quantità di dati di linguaggio naturale.
Vedere Entity linking e Elaborazione del linguaggio naturale
Et al.
et al. è un’abbreviazione delle espressioni latine et alii ("e altri"), et aliae ("e altre"), et alia ("e altre cose", con alia neutro plurale), oppure et alibi ("e altrove").
Vedere Entity linking e Et al.
Falso positivo e falso negativo
In statistica il falso positivo, analogo allerrore di primo tipo, è il risultato di un test che porta erroneamente ad accettare l'ipotesi sulla quale esso è stato condotto.
Vedere Entity linking e Falso positivo e falso negativo
George Washington
Fu comandante in capo dell'Esercito continentale durante tutta la guerra d'indipendenza americana (1775-1783) e divenne in seguito il primo presidente degli Stati Uniti d'America (1789-1797).
Vedere Entity linking e George Washington
Grafo
I grafi sono strutture matematiche discrete che rivestono interesse sia per la matematica che per un'ampia gamma di campi applicativi. In ambito matematico il loro studio, la teoria dei grafi, costituisce un'importante parte della combinatoria; i grafi inoltre sono utilizzati in aree come topologia, teoria degli automi, funzioni speciali, geometria dei poliedri, algebre di Lie.
Vedere Entity linking e Grafo
Information retrieval
L'information retrieval (IR), talvolta, meno di frequente, reso in lingua italiana come reperimento dell'informazione, è l'insieme delle tecniche utilizzate per gestire la rappresentazione, la memorizzazione, l'organizzazione e l'accesso ad oggetti contenenti informazioni quali documenti, pagine web, cataloghi online e oggetti multimediali.
Vedere Entity linking e Information retrieval
Linked data
I linked data o dati collegati, in informatica, sono una modalità di pubblicazione di dati strutturati che consente di collegare i dati fra di loro.
Vedere Entity linking e Linked data
Macchine a vettori di supporto
Le macchine a vettori di supporto (SVM, dall'inglese support-vector machines) sono dei modelli di apprendimento supervisionato associati ad algoritmi di apprendimento per la regressione e la classificazione.
Vedere Entity linking e Macchine a vettori di supporto
Motore di ricerca
Nell'ambito delle tecnologie di Internet, un motore di ricerca è un sistema automatico che analizza un insieme di dati (spesso da esso stesso raccolti) e restituisce un indice dei contenuti disponibili.
Vedere Entity linking e Motore di ricerca
PageRank
Il PageRank è un algoritmo di analisi che assegna un peso numerico ad ogni elemento di un insieme di documenti connessi per mezzo di collegamenti ipertestuali, ad esempio l'insieme delle pagine nel World Wide Web, con lo scopo di quantificare l'importanza relativa all'interno dell'insieme stesso.
Vedere Entity linking e PageRank
Polisemia
In semantica, la polisemia (dal greco polysemos, "dai molti significati", da polys, "molteplice", e sema, "segno") è la proprietà che una parola ha di esprimere più significati.
Vedere Entity linking e Polisemia
Query
In informatica, una query o interrogazione è un comando scritto dall'utente per ricavare informazioni riguardanti il contenuto di una base di dati.
Vedere Entity linking e Query
Ricerca semantica
La ricerca semantica è un campo di ricerca che cerca di migliorare l'accuratezza della ricerca nei motori di ricerca web cercando di comprendere l'intento del ricercatore e il significato contestuale dei termini adoperati al fine di generare risultati più rilevanti.
Vedere Entity linking e Ricerca semantica
Sistema di raccomandazione
Un sistema di raccomandazione o motore di raccomandazione è un software di filtraggio dei contenuti che crea delle raccomandazioni personalizzate specifiche per l’utente così da aiutarlo nelle sue scelte.
Vedere Entity linking e Sistema di raccomandazione
Stati Uniti d'America
Gli Stati Uniti d'America (comunemente indicati come Stati Uniti, o anche solo United States; in sigla USA) sono una repubblica federale dell'America settentrionale composta da cinquanta Stati e un distretto federale.
Vedere Entity linking e Stati Uniti d'America
Storia di Wikipedia
Wikipedia è un'enciclopedia online a contenuto libero nata il 15 gennaio 2001. Tra i suoi principi essenziali figurano il "punto di vista neutrale" e il rispetto del copyright.
Vedere Entity linking e Storia di Wikipedia
Tf-idf
La funzione di peso tf-idf (term frequency–inverse document frequency) è una funzione utilizzata in information retrieval per misurare l'importanza di un termine rispetto ad un documento o ad una collezione di documenti.
Vedere Entity linking e Tf-idf
Training e test set
Nell'apprendimento automatico un training set (in italiano insieme di addestramento o insieme di stima) è un insieme di esempi (spesso rappresentati come vettori di valori di attributi discreti o continui, le variabili di input) ad ognuno dei quali è associata una risposta, il valore di un attributo-obiettivo, ossia un valore categorico, cioè una classe, o un valore numerico.
Vedere Entity linking e Training e test set
Uniform Resource Identifier
In informatica, lo Uniform Resource Identifier (in acronimo URI) è una sequenza di caratteri che identifica universalmente ed univocamente una risorsa.
Vedere Entity linking e Uniform Resource Identifier
Uniform Resource Locator
Lo Uniform Resource Locator, anche noto con la sigla URL, è una sequenza di caratteri che identifica univocamente l'indirizzo di una risorsa su una rete di computer, come ad esempio un documento, un'immagine, un video, tipicamente presente su un host server e resa accessibile a un client.
Vedere Entity linking e Uniform Resource Locator
Washington
Washington D.C. (AFI:; in inglese) formalmente Distretto di Columbia, nota anche come Washington o D.C., è la capitale degli Stati Uniti d'America, con una popolazione di abitanti (abitanti nell'area metropolitana).
Vedere Entity linking e Washington
Wikidata
Wikidata è una base di conoscenza online collaborativa, sostenuta e ospitata dalla Wikimedia Foundation, con lo scopo di fornire un archivio comune di supporto agli altri progetti di Wikimedia, consultabile e modificabile sia da utenti umani che da bot.
Vedere Entity linking e Wikidata
Wikipedia
Wikipedia (pronuncia: vedi sotto) è un'enciclopedia online a contenuto libero, collaborativa, plurilingue e gratuita, nata nel 2001, sostenuta e ospitata dalla Wikimedia Foundation, un'organizzazione non a scopo di lucro statunitense.
Vedere Entity linking e Wikipedia
Word embedding
Il word embedding (tradotto letteralmente immersione di parole) anche conosciuto come rappresentazione distribuita delle parole permette di memorizzare le informazioni sia semantiche che sintattiche delle parole partendo da un corpus non annotato e costruendo uno spazio vettoriale in cui i vettori delle parole sono più vicini se le parole occorrono negli stessi contesti linguistici, cioè se sono riconosciute come semanticamente più simili (secondo l'ipotesi della semantica distribuzionale).
Vedere Entity linking e Word embedding
Word2vec
Word2vec è un insieme di modelli che sono utilizzati per produrre word embedding, il cui pacchetto fu originariamente creato in C da Tomas Mikolov, poi implementato anche in Pythonhttp://radimrehurek.com/gensim/models/word2vec.html e Java.
Vedere Entity linking e Word2vec