FM/Mag
Mdr: ricerche nel Deep Web
Miliardi di pagine non indicizzate formano il Deep Web, il “web profondo”, in cui vige la regola dell’anonimato. Normale chiedersi cosa ci sia in queste pagine nascoste a Google a agli altri motori di ricerca.
Si può rappresentare il web come un iceberg, in cui la parte emersa è il 10% della massa totale. Tutto il resto è Deep Web. Normale chiedersi cosa ci sia in questi miliardi di pagine nascoste a Google a agli altri motori di ricerca (Mdr).
Per i normali ricercatori, nel deep web non ci sono tesori informativi nascosti, anche perché è un ambiente di assoluto anonimato, quindi del tutto inaffidabile. Però utile sapere che cos’è il deep web e come funziona, perché da queste profondità del web a volte emergono informazioni, documenti, di cui serve comprendere le modalità di formazione.
I siti che scelgono di sottrarsi ai Mdr e quindi al pubblico ordinario, adottano diverse tecniche. La più semplice è quella di non essere indicizzati dai Mdr: basta un click sulla pagina web. E’ una pratica normale per i siti in costruzione o quando si ritiene che le pagine siano di interesse molto ristretto o riservato. Ma chi vuole veramente nascondersi utilizza protocolli di rete diversi da quelli Http, quali I2P, non-exit-relay, Freenet.
Cosa si trova nel deep web? Di tutto. Anche Edward Snowden e gli attivisti delle primavere arabe hanno usato il deep web per sfuggire la censura e i controlli. Poi ci sono forum, siti di organizzazioni spesso estremiste (è stato calcolato che ce ne sono almeno 50 mila) e anche siti di e-commerce illegali e/o fraudolenti.
Le presenze più note sono Wikileaks, e Strongbox del New Yorker, un sistema creato dal giornale «per dare agli informatori completa sicurezza e anonimato». Poi c’è Kavkaz, un sito di notizie anonime del Medio Oriente disponibile in russo, inglese, arabo e turco.
Livello 1 – Web indicizzato
Questo è il Web di tutti i giorni: ci sono i siti pubblici, i blog, i forum, le pagine dei social network ecc. Il tutto, indicizzato più o meno bene dai Mdr.
Livello 2 – Web riservato
Questo livello è ancora accessibile attraverso mezzi normali e contiene pagine e documenti riservati, come server aziendali o istituzionali, oltre a siti web ad accesso condizionato, come Reddit.
Reddit è un sito dove utenti registrati possono pubblicare contenuti sotto forma di post testuali o di link votabili dai partecipanti. Il tutto ruota su questi temi.
- Istruzione: News, Science, Space, Today I Learned e World News.
- Intrattenimento: Creepy, Documentaries, Gaming, Listen To This, Movies, Music, Sports, Television e Videos.
- Discussioni: Ask Reddit, Ask Science, Books, Explain Like Im Five, IAmA, No Sleep e Two X Chromosomes.
- Humor: Data Is Beautiful, Funny, Internet Is Beautiful, Jokes, Not The Onion, Shower Thoughts, TIFU e Uplifting News.
- Condivisione immagini: Art, Aww, Earth Porn, Gifs, Midly Interesting, Old School Cool, Pics e Photoshop Battles.
- Self-improvement: DIY, Fitness, Food, Get Motivated, Life Pro Tips, Personal Finance, Philosophy e Writing Prompts.
- Tecnologia: Futurology e Gadgets.
- Meta subreddits: Announcements e Blog.
Livello 3 – Web underground
In questo livello si possono trovare alcuni siti “underground ” ma ancora indicizzati, come 4chan, un sito di image board. Questo livello è l’ultimo normalmente accessibile: tutti i livelli che seguono questo devono essere accessibili con un proxy, TOR o altro.
Oltre il livello 3 non c’è nulla di interessante per chi cerca informazioni o documenti utilizzabili. Non solo. Non essendoci Mdr per queste aree, ci si deve affidare a liste, documenti, pagine wiki (costruite collettivamente da anonimi) che offrono una serie di link ordinati in categorie da copiare e incollare sul browser di Tor per visualizzarle sul Pc.
Dato che solo gli esperti sanno proteggere realmente i propri dati, principianti e dilettanti rischiano “come un turista che passeggia di notte nei peggiori quartieri di Bogotà, con uno scintillante Rolex al polso”.
Livello 4 – Deep Web
E’ accessibile solo attraverso Tor, (acronimo di The Onion Router) è un sistema di comunicazione anonima. Tor si interpone tra il tuo Pc e l’ambiente estereno, facendo da interfaccia anonima, ovvero inoltrando le richieste e le risposte dall’uno all’altro. Tor è stato creato a suo tempo per permettere la navigazione nelle nazioni in cui Internet era ed è soggetto alla censura. Tor garantisce l’anonimato attraverso il continuo rerouting su nodi. In altre parole, ogni PC connesso a TOR è un nodo, come in una rete P2P. Ecco perché è difficilissimo tracciarne le connessioni ed altrettanto facile sfuggire ai controlli. Inoltre nel deep web file come video, foto e documenti sono custoditi su computer di utenti diversi e obbediscono alla regola del peer-to-peer.
Livello 5 – Charter Web
Contiene forum più o meno temporanei (charter) di soggetti (dal disonesto al truffatore al delinquente) interessati ad attività illegali. È comunemente ritenuto “il mercato nero del web”.
Livello 6 – Mariana’s Web
Per accedere a questo livello, che prende il nome dalla Fossa delle Marianne, a quanto pare, c’è bisogno del “Polymeric Falcighol Derivation” che è un Quantum Computing. Ma chi possiede capacità di Quantum Computing? I governi.
A cura del “Corso Online di Ricerche e Motori di ricerche”, gratuito per gli iscritti a FirstMaster.
.
Deep web e hackers ovvero il lato oscuro della rete (video 8.35)