Logo
Unionpedia
Comunicazione
Disponibile su Google Play
Nuovo! Scarica Unionpedia sul tuo dispositivo Android™!
Installa
l'accesso più veloce di browser!
 

Crawler

Indice Crawler

Un crawler (detto anche web crawler, spider o robot), è un software che analizza i contenuti di una rete (o di un database) in un modo metodico e automatizzato, in genere per conto di un motore di ricerca.

42 relazioni: AltaVista, ASCII, Base di dati, Bot, C (linguaggio), C sharp, C++, Collegamento ipertestuale, Disco rigido, DuckDuckGo, Facebook, File system, File Transfer Protocol, GNU General Public License, Google, Httrack, Indicizzazione (motori di ricerca), Internet, Java (linguaggio di programmazione), Licenza ISC, Linux, Lucene, Memory Alpha, Microsoft .NET, Microsoft SQL Server, Motore di ricerca, Parsing, Peer-to-peer, Perl, PHP, Protocollo di esclusione robot, Python, Root (informatica), Screenshot, Script, Software, Teoma, Uniform Resource Locator, Unix, Web scraping, World Wide Web, Yahoo!.

AltaVista

AltaVista è stato un motore di ricerca ideato dalla Digital Equipment Corporation (DEC), uno dei primi motori di ricerca veloci della rete.

Nuovo!!: Crawler e AltaVista · Mostra di più »

ASCII

ASCII (acronimo di American Standard Code for Information Interchange, Codice Standard Americano per lo Scambio di Informazioni) è un codice per la codifica di caratteri.

Nuovo!!: Crawler e ASCII · Mostra di più »

Base di dati

Con base di dati o banca dati (a volte abbreviato con la sigla DB dall'inglese data base) in informatica si indica un insieme di dati, omogeneo per contenuti e per formato, memorizzati in un elaboratore elettronico e interrogabili via terminale utilizzando le chiavi di accesso previste.

Nuovo!!: Crawler e Base di dati · Mostra di più »

Bot

Il bot (abbreviazione di robot) in terminologia informatica in generale è un programma che accede alla rete attraverso lo stesso tipo di canali utilizzati dagli utenti umani (per esempio che accede alle pagine Web, invia messaggi in una chat, si muove nei videogiochi, e così via).

Nuovo!!: Crawler e Bot · Mostra di più »

C (linguaggio)

C è un linguaggio di programmazione imperativo di natura procedurale.

Nuovo!!: Crawler e C (linguaggio) · Mostra di più »

C sharp

Il C# (pronuncia:, come la parola inglese "see sharp") è un linguaggio di programmazione orientato agli oggetti sviluppato da Microsoft all'interno dell'iniziativa.NET, e successivamente approvato come standard dalla ECMA (ECMA-334) e ISO (norma ISO/IEC 23270).

Nuovo!!: Crawler e C sharp · Mostra di più »

C++

C++ è un linguaggio di programmazione orientato agli oggetti, con tipizzazione statica.

Nuovo!!: Crawler e C++ · Mostra di più »

Collegamento ipertestuale

In informatica, un collegamento ipertestuale (in inglese hyperlink, spesso chiamato anche link, usato anche in italiano) è un rinvio da un'unità informativa (documenti, immagini, etc.) su supporto digitale ad un'altra.

Nuovo!!: Crawler e Collegamento ipertestuale · Mostra di più »

Disco rigido

Un disco rigido o disco fisso – nonché denominato con le locuzioni inglesi hard disk drive (abbreviato comunemente in hard disk o con la sigla HDD) o fixed disk drive (abbreviato in fixed disk o FDD) in elettronica e informatica indica un dispositivo di memoria di massa di tipo magnetico che utilizza uno o più dischi magnetizzati per l'archiviazione dei dati (file, programmi e sistemi operativi).

Nuovo!!: Crawler e Disco rigido · Mostra di più »

DuckDuckGo

DuckDuckGo (abbreviato in DDG) è un motore di ricerca situato a Paoli, Pennsylvania che utilizza le informazioni di crowdsourcing provenienti da altri siti, ad esempio Wikipedia, con lo scopo di aumentare i risultati tradizionali e di migliorare la pertinenza della ricerca.

Nuovo!!: Crawler e DuckDuckGo · Mostra di più »

Facebook

Facebook è un social media e social network lanciato il 4 febbraio 2004, posseduto e gestito dalla società Facebook Inc., basato su una piattaforma software scritta in vari linguaggi di programmazione.

Nuovo!!: Crawler e Facebook · Mostra di più »

File system

Un file system (abbreviazione: FS), in informatica, indica informalmente un meccanismo con il quale i file sono posizionati e organizzati o su un dispositivo di archiviazione o su una memoria di massa, come un disco rigido o un CD-ROM e, in casi particolari, anche nella RAM.

Nuovo!!: Crawler e File system · Mostra di più »

File Transfer Protocol

File Transfer Protocol (FTP) (protocollo di trasferimento file), in informatica e nelle telecomunicazioni, è un protocollo per la trasmissione di dati tra host basato su TCP e con architettura di tipo client-server.

Nuovo!!: Crawler e File Transfer Protocol · Mostra di più »

GNU General Public License

La GNU General Public License, comunemente indicata con l'acronimo GNU GPL o semplicemente GPL, è una licenza fortemente copyleft per software libero, originariamente stesa nel 1989 da Richard Stallman per patrocinare i programmi creati per il sistema operativo GNU.

Nuovo!!: Crawler e GNU General Public License · Mostra di più »

Google

Google Search (pronuncia italiana; in inglese) è un motore di ricerca per Internet il cui dominio è stato registrato il 15 settembre 1997.

Nuovo!!: Crawler e Google · Mostra di più »

Httrack

HTTrack è un'applicazione Open source sviluppata da Xavier Roche per il mirroring di siti web su supporto locale per navigazione offline.

Nuovo!!: Crawler e Httrack · Mostra di più »

Indicizzazione (motori di ricerca)

Per indicizzazione si intende l'inserimento di un sito web o un blog nel database di un motore di ricerca.

Nuovo!!: Crawler e Indicizzazione (motori di ricerca) · Mostra di più »

Internet

Internet è una rete ad accesso pubblico che connette vari dispositivi o terminali in tutto il mondo.

Nuovo!!: Crawler e Internet · Mostra di più »

Java (linguaggio di programmazione)

In informatica Java è un linguaggio di programmazione ad alto livello, orientato agli oggetti e a tipizzazione statica, specificatamente progettato per essere il più possibile indipendente dalla piattaforma di esecuzione.

Nuovo!!: Crawler e Java (linguaggio di programmazione) · Mostra di più »

Licenza ISC

La licenza ISC è stata scritta dal Internet Systems Consortium (ISC) ed è funzionalmente equivalente ad una licenza BSD a 2 clausole, ma semplificata rimuovendo il testo "reso inutile dalla convenzione di Berna".

Nuovo!!: Crawler e Licenza ISC · Mostra di più »

Linux

Linux (pronuncia inglese) è una famiglia di sistemi operativi di tipo Unix-like, pubblicati sotto varie possibili distribuzioni, aventi la caratteristica comune di utilizzare come nucleo il kernel Linux.

Nuovo!!: Crawler e Linux · Mostra di più »

Lucene

Lucene è una API gratuita ed open source per il reperimento di informazioni inizialmente implementata in Java da Doug Cutting.

Nuovo!!: Crawler e Lucene · Mostra di più »

Memory Alpha

Memory Alpha è un progetto collaborativo sul Web che si propone la realizzazione di una enciclopedia elettronica multilingue sull'universo di Star Trek.

Nuovo!!: Crawler e Memory Alpha · Mostra di più »

Microsoft .NET

.NET è una piattaforma di sviluppo general purpose che mette a disposizione varie funzionalità come il supporto per più linguaggi di programmazione (coprendo tutti i paradigmi di programmazione: object oriented, procedurali, funzionali, imperativi, user oriented, ecc.), modelli di programmazione asincroni e simultanei, interoperabilità, consentendo l'esecuzione su più piattaforme ed in presenza di scenari applicativi variegati.

Nuovo!!: Crawler e Microsoft .NET · Mostra di più »

Microsoft SQL Server

In informatica Microsoft SQL Server è un DBMS relazionale (Relational Database Management System RDBMS), prodotto da Microsoft.

Nuovo!!: Crawler e Microsoft SQL Server · Mostra di più »

Motore di ricerca

Nell'ambito delle tecnologie di Internet, un motore di ricerca (in inglese search engine) è un sistema automatico che, su richiesta, analizza un insieme di dati (spesso da esso stesso raccolti) e restituisce un indice dei contenuti disponibili classificandoli in modo automatico in base a formule statistico-matematiche che ne indichino il grado di rilevanza data una determinata chiave di ricerca.

Nuovo!!: Crawler e Motore di ricerca · Mostra di più »

Parsing

In informatica, il parsing, analisi sintattica o parsificazione è un processo che analizza un flusso continuo di dati in ingresso (input, letti per esempio da un file o una tastiera) in modo da determinare la sua struttura grazie ad una data grammatica formale.

Nuovo!!: Crawler e Parsing · Mostra di più »

Peer-to-peer

In informatica, peer-to-peer (P2P; 'rete paritaria/paritetica') è un'espressione indicante un modello di architettura logica di rete informatica in cui i nodi non sono gerarchizzati unicamente sotto forma di client o server fissi ('clienti' e 'serventi'), ma pure sotto forma di nodi equivalenti o 'paritari' (peer), potendo fungere al contempo da client e server verso gli altri nodi terminali (host) della rete.

Nuovo!!: Crawler e Peer-to-peer · Mostra di più »

Perl

Perl è un linguaggio di programmazione ad alto livello, dinamico, procedurale e interpretato, creato nel 1987 da Larry Wall.

Nuovo!!: Crawler e Perl · Mostra di più »

PHP

PHP (acronimo ricorsivo di "PHP: Hypertext Preprocessor", preprocessore di ipertesti; originariamente acronimo di "Personal Home Page") è un linguaggio di scripting interpretato, originariamente concepito per la programmazione di pagine web dinamiche.

Nuovo!!: Crawler e PHP · Mostra di più »

Protocollo di esclusione robot

Il protocollo di esclusione robot indica, nel gergo di internet e più in generale del web, le regole indicate dai gestori di un sito web ai crawler che lo visitano, chiedendo di applicare restrizioni di analisi sulle pagine del sito.

Nuovo!!: Crawler e Protocollo di esclusione robot · Mostra di più »

Python

Python è un linguaggio di programmazione ad alto livello, orientato agli oggetti, adatto, tra gli altri usi, per sviluppare applicazioni distribuite, scripting, computazione numerica e system testing.

Nuovo!!: Crawler e Python · Mostra di più »

Root (informatica)

In informatica il termine root (radice in lingua inglese) indica il punto iniziale del file system.

Nuovo!!: Crawler e Root (informatica) · Mostra di più »

Screenshot

Il termine inglese screenshot (da screen che significa "schermo" e shot invece "scatto fotografico"), in italiano fermo-immagine, schermata o immagine dello schermo, indica ciò che viene visualizzato in un determinato istante sullo schermo di un monitor, di un televisore o di un qualunque dispositivo video.

Nuovo!!: Crawler e Screenshot · Mostra di più »

Script

Il termine script, in informatica, designa un tipo particolare di programma, scritto in una particolare classe di linguaggi di programmazione, detti linguaggi di scripting.

Nuovo!!: Crawler e Script · Mostra di più »

Software

Il software è l'informazione o le informazioni - utilizzate da uno o più sistemi informatici - memorizzate su uno o più supporti informatici e che possono essere rappresentate da uno o più programmi, da uno o più dati, oppure da una combinazione di questi due.

Nuovo!!: Crawler e Software · Mostra di più »

Teoma

Teoma, pronunciato tay-o-ma, era un motore di ricerca Internet fondato nel 2000 dal professor Apostolos Gerasoulis e dai suoi colleghi dell'Università di Rutgers nel New Jersey, in collaborazione con Il professor Tao Yang dall'Università della California.

Nuovo!!: Crawler e Teoma · Mostra di più »

Uniform Resource Locator

La locuzione Uniform Resource Locator (in acronimo URL), nella terminologia delle telecomunicazioni e dell'informatica, è una sequenza di caratteri che identifica univocamente l'indirizzo di una risorsa in Internet, tipicamente presente su un host server, come ad esempio un documento, un'immagine, un video, rendendola accessibile ad un client.

Nuovo!!: Crawler e Uniform Resource Locator · Mostra di più »

Unix

Unix (registrato ufficialmente come UNIX) è un sistema operativo portabile per computer inizialmente sviluppato da un gruppo di ricerca dei laboratori AT&T e Bell Laboratories, nel quale figurarono sulle prime anche Ken Thompson e Dennis Ritchie.

Nuovo!!: Crawler e Unix · Mostra di più »

Web scraping

Il web scraping (detto anche web harvesting o web data extraction) è una tecnica informatica di estrazione di dati da un sito web per mezzo di programmi software.

Nuovo!!: Crawler e Web scraping · Mostra di più »

World Wide Web

Il World Wide Web (letteralmente "rete di grandezza mondiale"), abbreviato Web, sigla WWW o W3, è uno dei principali servizi di Internet, che permette di navigare e usufruire di un insieme molto vasto di contenuti amatoriali e professionali (multimediali e non) collegati tra loro attraverso legami (link), e di ulteriori servizi accessibili a tutti o ad una parte selezionata degli utenti di Internet.

Nuovo!!: Crawler e World Wide Web · Mostra di più »

Yahoo!

Yahoo! è un portale web di servizi Internet rivolto al mondo business e consumer, fondato nel 1994 da David Filo e Jerry Yang, allora studenti presso la Stanford University.

Nuovo!!: Crawler e Yahoo! · Mostra di più »

Riorienta qui:

Web Crawler, Web crawler, Web crawling, Web robot, Web spider.

UscenteArrivo
Ehi! Siamo su Facebook ora! »