1. Il World Wide Web e i motori di ricerca.

 

a) Alcune notizie su Internet e sul World Wide Web.
Un aspetto non trascurabile dell’informatica giuridica è oggi costituito dalla possibilità di ricercare sul web i documenti di interesse giuridico contenuti in innumerevoli banche dati elettroniche del cyberspazio, aventi ad oggetto sistemi giuridici del mondo intero.

Internet è una rete internazionale di computers che comunicano tra di loro grazie a protocolli di scambio di dati standard. Più esattamente, Internet è una rete di reti, un’ «interrete», appunto, come è anche dimostrato dal fatto che il termine  «Internet» viene dall’inglese «internetwork». I diversi computers collegati alla rete Internet possono comunicare insieme in maniera comprensibile per l’utente, indipendemente dai tipi di computer utilizzati (Mac, PC, Unix o altri), utilizzando però dei programmi aggiornati. All’origine, Internet collegava tra di loro i siti informatici delle Forze Armate statunitensi.
Informazioni utili sulla storia e sull’evoluzione di Internet sono reperibili nei seguenti siti:

 

·         http://www.anderbergfamily.net/ant/history/

·         http://www.webwarrior.org/istoria/

·         http://www.jus.unitn.it/faculty/lesson/inf-base/appunti/pegasus/index.htm.

 

Internet si estende oggi a tutto il pianeta e contiene siti assai diversificati tra di loro:

La rete continua a crescere e a diversificarsi ogni giorno.

Internet è però anche un’autostrada elettronica o mezzo di comunicazione, che si serve dei

 

Essa è gestita da comitati di rappresentanti di ogni paese. I providers, dal canto loro, si occupano solo di assicurare la funzionalità della rete, mentre il contenuto e le informazioni dei vari files disponibili in rete e la loro organizzazione restano soggetti alla responsabilità di ogni singolo sito.

Infine Internet è anche una vera e propria biblioteca virtuale, dove è possibile reperire files, testi, immagini, suoni, filmati e altre informazioni che ogni soggetto attivo della rete ha voluto porre a disposizione della comunità degli internauti. Vi si possono così trovare libri, periodici, giornali, programmi software, films, tutti in formato elettronico e dunque «virtuale».

 

A questo proposito sarà utile ricordare che, oltre a costituire in sé un’enciclopedia, Internet è il luogo nel quale possono trovarsi svariate enciclopedie consultabili online.

Un’interessante enciclopedia online su Internet, che ci consente di avere definizioni di termini riguardanti il web e indirizzi utili è Webopaedia. Un’enciclopedia assai più «tradizionale» è invece l’Enciclopedia Britannica, disponibile gratuitamente in una versione ridotta, ma che fornisce anche dei rinvii ad ulteriori informazioni.

Uno stimolante esperimento riguarda invece un’enciclopedia formata, creata ed arricchita dagli stessi utenti di Internet: si tratta di Wikipedia, che mette altresì a disposizione voci in varie lingue straniere. La consultazione è interamente gratuita.

Per un paio di guide on line di Internet in italiano cfr.

 

·         http://www.liberliber.it/biblioteca/e/electronic_frontier_foundation/guida_a_internet_della_electronic_frontier_foundation_v3_15/html/

·         http://www.jus.unitn.it/faculty/lesson/inf-base/appunti/pegasus/index.htm.

 

Per una guida in francese cfr. GIRI - Guide d’initiation à la recherche dans Internet, al seguente sito:
<http://www.bibl.ulaval.ca/vitrine/giri/mod1/1survol.htm>.

In generale, sul tema «giuristi e Internet» cfr., per l’Italia, BRUGALETTA, Internet per giuristi, Napoli, 1998 ; 2a edizione, Napoli, 1999; per la Francia, TORTELLO e LOINTIER, Internet pour les juristes, Paris, 1996; per la Germania TIEDEMANN, Internet für Juristen. Eine praxisorientierte Einführung, Darmstadt, 1999.

Il servizio più importante (e nel contempo più conosciuto) tra quelli che caratterizzano Internet (su cui cfr. infra, § 5)  è dato dal World Wide Web (WWW, chiamato anche W3 o, encora più familiarmente, il Web). Questa modalità utilizza il protocollo HTTP (Hypertext Transfer Protocol) per lo scambio di informazioni tra il computer client, cioè quello del navigatore, e il server con cui ci si collega: esso si basa dunque su di un gigantesco sistema di ipertesti. L'ipertesto è un documento elettronico composto a sua volta di più documenti collegati tra di essi da «nodi» (in inglese links, cioè legami) che l’utente può azionare semplicemente cliccando su uno o più termini posti in evidenza nel testo-base (cfr. OBERTO, Appunti per un corso di informatica giuridica (A.A. 1998/99), Sez. II, § 6.1).
 

b) I motori di ricerca.
Internet contiene un numero di pagine letteralmente sterminato. Si pensi che oggi neanche i più esperti ed attenti conoscitori della realtà del web sono in grado di fornire cifre attendibili al riguardo. Così, per esempio, mentre nel giugno 2000 Google annunciava di avere censito oltre un miliardo di pagine web, pochi giorni dopo la Bright Planet dichiarava ufficialmente che il numero dei documenti online si aggirava addirittura attorno ai 550 miliardi (quest’ultima informazione è riferita da PARRINI e BITE, I motori di ricerca nel caos della rete. Kit di sopravvivenza, Milano, Shake Edizioni Underground, 2001, p. 101). Secondo un comunicato stampa della Cyveillance in data 10 luglio 2000 le pagine web avrebbero superato certamente i  due miliardi, con un "tasso di crescita" di 7 milioni al giorno.

 

Come orientarsi all’interno di questa massa imponente di informazioni (sul tema del diluvio di informazioni cfr. l’articolo di LEVY, Il diluvio informazionale, al sito <http://www.emsf.rai.it/aforismi/aforismi.asp?d=248>)? La ricerca dei documenti (ivi compresi, ovviamente, quelli di interesse giuridico) può essere effettuata tramite uno o più motori di ricerca, che non sono altro che siti specializzati nella catalogazione dei milioni di pagine web che si trovano sulla rete mondiale. Un’altra definizione dei motori di ricerca è quella secondo cui essi sono delle complesse macchine basate sia su risorse umane, sia su automatismi. Il funzionamento di siffatti meccanismi è quanto mai complesso e ha dato luogo ad una serie di studi piuttosto interessanti, che si caratterizzano non solo per la messe di informazioni e di suggerimenti pratici, ma anche per gli inviti a guardare con occhio distaccato e critico questi particolari «oggetti misteriosi», costituiti dai motori di ricerca. Così, in un lavoro di successo sull’argomento si legge, per esempio, quanto segue:
 

«Il motore di ricerca è visto in particolare dalla maggior parte degli utenti come un dispositivo sicuro c affidabile, una sorta di oracolo telematico, dal quale ci si aspetta estrema velocità e garanzia nelle risposte. L’utente medio, di fronte all’interfaccia pulita, amichevole e funzionale del motore di ricerca utilizzato, proietta il proprio bisogno di sicurezza e di razionalità scientifica, non preoccupandosi assolutamente di cosa ci sia dietro al semplice form in cui immette la richiesta. L’utente medio, tuttavia, dovrebbe ricordarsi che i principali motori di ricerca sono delle organizzazioni puramente commercials, delle aziende che trattano la gestione delle informazioni, che a tutt’oggi procurano immensi guadagni e le cui quotazioni in Borsa influenzano pesantemente l’andamento dei maggiori indici internazionali» (cfr. il volume testé citato di PARRINI e BITE, I motori di ricerca nel caos della rete. Kit di sopravvivenza).
Degli stessi Autori cfr. inoltre le informazioni al sito seguente: <http://www.strano.net/chaos/>, dove sono raccolte e ripresentate notizie in gran parte contenute nel volume appena citato.

Quali sono i principali motori di ricerca? Al riguardo va subito detto che vi sono, in primo luogo, dei motori «generici», il cui ambito di operatività si estende a tutto il web. Tra questi si potranno citare per esempio i seguenti:

Tra i motori di ricerca «generici» va segnalato in particolare

 

 

Altri motori sono invece specializzati con riguardo a determinate realtà nazionali:
Cfr. per esempio, per l’Italia:

per la Francia:

Si tenga presente, peraltro, che i motori limitati a determinate realtà nazionali rischiano, proprio per la ristrettezza del loro «campo d’azione», di fornire risultati riduttivi ed insoddisfacenti.
Ancora, e sempre senza pretesa di completezza, si potrà dire che vi sono motori specializzati nella ricerca di oggetti specifici. Così, per esempio, vi sono sezioni specializzate nella ricerca di immagini (<http://www.altavista.com/image/default>) oppure di files MP3 (<http://mp3.lycos.com>).

Oggi il campo d’azione ed il numero dei motori di ricerca è divenuto tanto ampio da giustificare l’esistenza di siti prevalentemente o esclusivamente dedicati a tale argomento. E’ il caso, per esempio, di SEARCHENGINE WATCH, sito americano che raccoglie una massa imponente di informazioni sui search engines, sulle loro applicazioni, sulle modalità di ricerca attraverso essi, ecc. Per una versione italiana, ricca di suggerimenti pratici sull’utilizzo dei motori, cfr. il sito MOTORIDIRICERCA.IT <http://www.motoridiricerca.it/>.

Di un certo interesse è poi anche la pagina dedicata ai motori di ricerca del sito della Regione Piemonte:

http://www.consiglioregionale.piemonte.it/giuridico/.

 

Per accelerare la ricerca e di diminuire le possibilità d’errore ci si può anche rivolgere a dei siti che raggruppano a loro volta più motori di ricerca: si parla qui di metamotori di ricerca.Cfr. per esempio:

Non bisogna però trascurare il fatto che, man mano che il numero delle pagine web aumenta, i motori di ricerca si trovano sempre più in difficoltà a catalogare il materiale on-line. Si pensi, al riguardo, che, già nel luglio 1999, si stimavano in 800 milioni le pagine web, di cui solo la sesta parte sarebbe stata indicizzata dai motori di ricerca (cfr. al riguardo l’articolo pubblicato su L’Espresso del 22 luglio 1999, p. 156); all’incirca due anni dopo (18 aprile 2001) Google dichiarava che le pagine passate in rassegna da tale motore ammontavano a 1.346.966.000), su un numero complessivo già all’epoca sicuramente superiore ai due miliardi! Gli stessi studiosi della materia ammettono che la porzione della rete analizzata dai motori di ricerca è veramente esigua. Così, secondo uno studio pubblicato da Nature nel 1999 (Vol. 400, 8 luglio 1999), la parte di rete presa in considerazione da Altavista sarebbe solo del 12%, quella di Northernlight del 16% e quella di Lycos solo il 2,5%.

Numerosissimi sono ormai i motori specializzati per singole materie. Per un interessante e ricchissimo elenco al riguardo si potrà consultare la collection of special search engines dell’Università di Leida.

 

Per quanto riguarda i motori di ricerca specializzati nei siti di interesse giuridico si possono qui ricordare i seguenti:

per una lista «francofona» di motori di ricerca cfr. anche il sito:

per i motori di ricerca italiani specializzati nel campo giuridico:

L’indicazione di ulteriori motori specializzati nel settore giuridico è reperibile nel sito della Regione Piemonte:

http://www.consiglioregionale.piemonte.it/giuridico/motori_ricerca_specializzati.htm.

 


Il sito Whowhere? è invece specializzato nella ricerca di persone e di dati relativi alle persone in rete (indirizzi, e-mail, home pages, ecc.). Per altri siti specializzati nella ricerca di indirizzi di posta elettronica si vedano i siti seguenti:
Bigfoot <http://www.bigfoot.com>,
Yahoo People Search <http://www.people.yahoo.com>,
Internet Address Finder <http://www.iaf.net>,
Switchboard <http://www.switchboard.com>,
Infospace <http://www.infospace.com>.
 

c) Operatori logici e agenti intelligenti.
Anche qui gli operatori logici dell’algebra booleana giocano un ruolo decisivo, specie di fronte alla massa dei documenti on line. E’ un vero peccato che quasi ogni motore si senta in dovere di seguire regole assolutamente... personali per la formulazione delle stringhe di ricerca, obbligando in tal modo l’utente ad imparare, motore per motore, quale sia la sintassi corretta al fine di esprimere regole logiche che, peraltro, hanno un valore assolutamente generale; per un quadro comparativo delle funzionalità dei principali motori di ricerca mondiali cfr. il seguente sito: <http://www.motoridiricerca.it/tabella.htm#tabella>.
Un’ottima guida online in italiano sull’uso dei motori di ricerca e degli operatori logici si trova al seguente indirizzo:
<http://www.motoridiricerca.it/suggeri.htm>.

In alternativa, è possibile acquistare sul web appositi softwares di gestione dei motori di ricerca; cfr. per esempio i prodotti commercializzati presso i seguenti siti:

Un ruolo sempre più importante nel futuro della ricerca su Internet è, infine, svolto dai c.d. «agenti intelligenti».
 

d) Browsers specializzati per giuristi.
Un esperimento di un certo interesse, che risultava effettuato solo in Germania, concerneva la creazione di un browser dedicato alla navigazione attraverso i siti giuridici, posto a disposizione gratuitamente di tutti gli utenti. Tale prodotto era stato realizzato da un sito tedesco chiamato RA-MICRO. Esso era scaricabile (ancora alla data del 21 aprile 2001) gratuitamente al seguente sito: <http://www.ra-micro.de/recht/jurbrow/browsfrm.htm>. Purtroppo l’installazione era piuttosto complessa. Una volta scaricato il file 32interv.exe occorreva infatti scompattarlo. Esso dava luogo, tra l’altro, ad una directory chiamata Juristen Browser, contenente, tra l’altro, una sub-directory chiamata MDB. In quest’ultima directory andavano collocati i due files (links.mdb e zzz.tmp) che si ottenevano scompattando il file update.exe.
Una volta installato, il browser consentiva una veloce navigazione all’interno di svariati siti di interesse giuridico, catalogati e ordinati nella Startseite, nella forma "a ramo d’albero". I siti in questione erano per lo più tedeschi e dedicati alla realtà giuridica della Germania, ma non mancavano riferimenti al diritto straniero (specie dei Paesi della Common Law) ed internazionale.
In seguito, però, il prodotto è stato rimosso dalla parte liberamente accessibile del sito. Il sito in questione, all’indirizzo <http://www.ra-micro.de> pone ora in vendita un prodotto più complesso, denominato ra-micro, nel quale il juristenbrowser è integrato: cfr. la pagina web seguente:

http://www.advonet.info/ju6501.htm.

Per un esperimento italiano di browser per giuristi, peraltro dai risultati tutt’altro che eccellenti (in considerazione, tra l’altro, della base di dati estremamente ridotta di cui dispone) era reperibile (ora non lo è più) al sito seguente:
<http://www.ulisseagent.com/ulissemanuale.htm>.
Già nelle precedenti edizioni di questo testo si sconsigliava peraltro l’installazione di tale programma, che occupava inutilmente una parte non trascurabile del disco rigido.

Si ricorda ancora che al sito <http://www.bluesquirrel.com> era reperibile - ma a pagamento - anche un "legalseeker", motore di ricerca specializzato in siti giuridici (per lo più di Common Law): cfr. <http://www.bluesquirrel.com/products/seeker/legalseeker.html>; peraltro il "Legalseeker" è stato successivamente integrato nel nuovo prodotto denominato "WebSeeker", prodotto disponibile sempre a pagamento.
 

e) Nuove ed insolite strategie di ricerca.
I testi specializzati in materia di ricerca a mezzo dei motori insistono sulla necessità di sfruttare non solo la modalità ipertestuale (WWW) della rete, bensì di utilizzare tutte le potenzialità offerte da Internet. Ecco qui di seguito una raccolta di consigli tratti da una pubblicazione sull’argomento (PARRINI e BITE, I motori di ricerca nel caos della rete. Kit di sopravvivenza, cit., p. 48 s.):

Una buona ricerca in Rete deve essere performativa, deve così fondarsi su di un criterio efficientistico, nel tentativo di ottimizzare le capacità tecniche del mezzo; ma deve anche essere in grado di integrare l’impiego della tecnologia con la creatività. Suggeriamo in questo senso un possibile percorso di ricerca:

Ritorno al sommario

§ successivo

 

1