Archive for the 'Motori di ricerca' Category

La cosa che verrà dopo il browser

John Battelle sul passaggio di Ben Goodger a Google:

Sono sicuro che questo farà ripartire le congetture sul gbrowser, ma penso che sia molto più interessante congetturare sulla cosa che verrà dopo il browser, qualunque essa sia.

La cosa che verrà dopo il browser suona minacciosa e interessante al tempo stesso. Mettiamo insieme il distributed data-center, internet come piattaforma, gli sviluppi nel browser (content rendering, rich client programming, ecc) e la messaggistica, e viene fuori qualcosa che sta agli antipodi di Longhorn.

Longhorn vuole rendere irrilevante il browser.

La cosa che verrà dopo il browser serve, ovviamente, a rendere irrilevante il sistema operativo.

Gli abbagli del Times sulla telefonia di Google

Ormai la caccia al prossimo servizio di Google ha contagiato anche la stampa generalista. La qualità dei risultati è quella che ci si può aspettare: Il Times, una volta autorevole giornale di Londra fantastica di una possibile offerta VoIP da parte di Google. Unica prova, la ricerca di un negoziatore per l’acquisto di fibra scura, e le domande a qualche analista. Ovviamente Google ha smentito.

Luca di Pandemia è giustamente scettico, mentre Om MalikTechdirt usa la metafora giusta: sembra il vecchio gioco del del telefono senza fili. Un gruppo di bambini si mette in cerchio, uno inizia sussurrando una frase nell’orecchio del vicino, si procede a passare la frase lungo il cerchio e si vede come è cambiata alla fine. Sostituite la rete al cerchio e bloggers e giornalisti ai bambini, et voilà lo scoop sulla telefonia VoIP di Google del Times.

John Battelle, forse il più acuto Google-watcher dice che si terrà lontano da questa ridicola supposizione, citando il fatto di essersi sbagliato clamorosamente su GMail.

Secondo me l’acquisto di fibra per fare telefonia via Internet sarebbe una specie di follia da parte di Google. I margini nella telefonia VoIP tendono a zero: troppi nuovi entranti, troppo basse le barriere all’ingresso. Se anche Google volesse offrire un GPhone, troverebbe decine (o centinaia) di compagnie di telefonia che camminerebbero sui carboni ardenti per fornire un backend di telefonia a Google.

La ragione per cui Google cerca fibra è più probabilmente dovuta alla necessità di garantire migliore connettività tra i propri datacenter spendendo meno, e avere meno rischi di trovare ostacoli nello sviluppo della piattaforma Web.

Update: corretto riferimento errato a Om Malik anzichè Techdirt …

MPAA e Isohunt

Isohunt è un motore di ricerca per Bittorrent, che funziona piuttosto bene. Già un paio di settimane fa Antonio mi segnalava che avevano già ricevuto una lettera “cease & desist” (invito a cessare e desistere) dalla MPAA (l’associazione delle imprese cinematografiche americane).

Fortunatamente il gestore di Isohunt ci tiene informati riguardo alla sua corrispondenza con i legali della MPAA. Nell’ultimo update c’è la sua risposta alla più recente lettera minatoria, in cui sembra cavarsela molto meglio con la comprensione della legge e di come funziona la rete rispetto alla sua controparte legale.

Quello che mi stupisce è che la MPAA non usa Isohunt per trovare torrents che violino il copyright dei suoi associati, e per rintracciare chi davvero ospita i torrents e i tracker. No, la MPAA vuole che il gestore di Isohunt analizzi uno per uno i torrents trovati dal suo spider per decidere se sono legali o meno.

Non ci sono dubbi che buona parte del materiale indicizzato da Isohunt non sia autorizzato dai detentori del diritto d’autore, e che grazie ad Isohunt avvengano molte violazioni di questo diritto.

Ciò non toglie che una rete che opera secondo i metodi che la MPAA vuole imporre al gestore di Isohunt è una rete inutile.

Trovo ridicola la pretesa della MPAA che Isohunt smetta di inserire tra i risultati di ricerca materiali appartenenti ai suoi associati, quando non è neanche disposta a fornire un elenco di quali siano questi materiali, e le prove che questi materiali appartengano davvero ai suoi associati.

La MPAA vuole che gli operatori dei motori di ricerca facciano il lavoro sporco al posto suo. Troppo comodo. Gli unici che realmente violano i diritti degli associati della MPAA sono coloro che ospitano i tracker, e coloro che caricano e scaricano il materiale. Non gli operatori di directory. Non gli operatori di motori di ricerca.

link rel=nofollow

Molta discussione in rete su una piccola questione tecnica.

Google ha annunciato che aggiungendo ad un link l’attributo rel="nofollow", il link in questione non sarà considerato nel calcolo del pagerank. L’idea è che rel="nofollow" venga utilizzato nei contesti tipo commenti nei weblog, dove gli spammer cercano di sfruttare il pagerank del blog per meglio posizionare i propri siti web nei motori di ricerca.

Ad essere sincero, non mi piace molto l’idea. Alcuni motivi:

  • Basta che pochi non lo usino, perchè gli spammer continuino a provarci, tenendo alti costi di hosting e delle contromisure. Sta succedendo adesso con il referrer spam. Si è già visto che non basta ridurre l’incentivo per eliminare lo spam sia via posta che via blog;
  • Se usato in maniera indiscriminata, punisce i link “interessanti” nei commenti. Se sono già in grado di distinguere tra spam e commenti legittimi, lo spam va eliminato, non “castrato”;
  • Se deve essere usato, come suggerisce Scoble, per poter linkare ad aziende/persone che non ci piacciono senza aumentarne il pagerank, costa fatica. Preferirei che Google e gli altri motori di ricerca accomodassero la “pigrizia” dei blogger, e fossero in grado di distinguere quando dico “adoro x” rispetto a “x fa schifo”, e comportarsi di conseguenza.

Picasa 2

Nuova versione per il software di gestione delle immagini di Google: Picasa 2 è disponbile al pubblico. Solo inglese. Solo windows. Fattori redimenti: è gratis e fortunatamente non è una beta pubblica. Sono abbastanza stufo di beta pubbliche eterne. O di pre-annunci di beta pubbliche.

Google e la fibra scura

Google è alla ricerca di un “Negoziatore Strategico con esperienza nell’identificazione, selezione e negoziazione di contratti per fibra scura sia in ambito metropolitano che sulla lunga distanza, per la costruzione di un backbone di rete globale”.

Per fibra scura si intendono quei tratti di fibra ottica che sono stati posati ma ancora non in uso.

Potrebbe essere semplcemente una mossa per approfittare del mercato depresso della connettività in fibra e risparmiare sulla connettività da e tra i propri datacenter. Potrebbe essere qualcosa di più.

Yahoo Desktop Search ed altri

Finalmente disponibile al pubblico anche Yahoo! Desktop Search. Oltre 200 tipi di file indicizzati. Purtroppo, non solo è “windows only”, è XP/2000 only.

Su Yahoo Search Blog un pò di sano orgoglio per il tool di casa. Le doti vantate:

  • Ricerca incrementale (find-as-you-type), i risultati compaiono man mano che si scrivono i termini di ricerca;
  • Live preview per molti dei tipi di file supportati, in modo da essere costretti ad aprire le applicazioni per verificare le corrispondenze;
    1. Nel frattempo è arrivata la versione Mac di Blinkx.

      [Via John Battelle]

Password di default e motori di ricerca

Più diventanon efficaci e sofisticati i motori di ricerca, più impietosi sono gli effetti che possono avere.

La ricerca di lavoro che può essere mandata a monte da una semplice query su Google che svela particolari imbarazzanti sul candidato.

Il worm che si diffonde cercando vulnerabilità tramite Google.

Ultima (solo per ora) in ordine di tempo, da qualche giorno circola la notizia della ricerca che permette di scovare telecamere di sicurezza insufficientemente protette.

Il problema è rappresentato dalle network cams (di Axis e Panasonic, ad esempio). Ottimi prodotti, potenzialmente sicuri, ma in questo caso comprate e configurate da un gregge di utenti disattenti.

[Via The Register]

Technorati watchlists

Dave Sifry annuncia Keyword Watchlist, una nuova funzione di Technorati per avere sempre sotto controllo quali blog parlino dei termini di interesse. Simile ai feed per le ricerche di Feedster. Ad esempio, ho creato una watchlist di test (modifiche legge urbani, nella vana speranza di sentirne parlare ancora), la differenza tra Feedster e Technorati è che nella lista di Feedster compare anche Punto Informatico (anche se si cerca di limitare la ricerca ai soli blog).

Per creare una watchlist è sufficiente registrarsi e cliccare su “make this a watchlist” dopo aver fatto una ricerca su Technorati. Niente di particolarmente nuovo, ma la concorrenza tra motori di ricerca è sempre gradita.

Update: Dave Sifry illustra le differenze tra le watchlist di Technorati e le ricerche di Feedster e PubSub. In sostanza, Sifry sostiene che i risultati di Technorati sono aggiornati più in fretta, sono più completi perchè Technorati indicizza i post direttamente, non solo i feed (per i feed non full-text) e rispondomo meglio a query complesse. Sifry dice anche che Technorati ha una maggiore “memoria storica” (tutti i post da due anni fa ad adesso), mentre PubSub indicizza solo “il presente”. Agli utenti la sentenza.

isoHunt - motore di ricerca Bittorrent

isoHunt, altro motore di ricerca Bittorrent e IRC [Via Jeremy Zawodny's Linkblog].

Zeitgeist depression

Il più grande motore di scoperta di conoscenza finora realizzato. Otto miliardi di pagine indicizzate. Una significativa frazione della conoscenza umana esplorabile digitando pochi tasti.

E come lo usiamo ? Lo zeitgeist di Google ci informa che lo usiamo per scoprire, tutto lo scopribile, possibilmente nel senso fisico del termine, su (nell’ordine) Britney Spears, Paris Hilton, Christina Aguilera e Pamela Anderson.

Incredible la vertiginosa ascesa della P di Google (Paris Hilton), come il sempreverde fascino che la Anderson continua ad esercitare. Si sa cosa accomuna le due: il rilascio accidentale di video porno amatoriali girati da fidanzato o marito.

Forse è cinico, ma viene da fare una piccola previsione per il 2005 (o forse per qualche anno successivo): il video porno amatoriale “accidentalmente diffuso” diventerà un altro strumento nell’arsenale per il sostentamento delle celebrità decotte (o in quello per celebrità aspiranti).

Il worm che si propaga usando Google

Google ha messo i bastoni tra le ruote al worm che si propagava usando Google per cercare installazione vulnerabili di phpBB, un software open-source per la gestione di forum. Google sembra essere molto reattiva ai problemi di sicurezza: ieri era stata tappata in poche ore la falla di Google Desktop Search.

Google Suggest vivisezionato

Google Suggest vivisezionato e dis-offuscato [via Slashdot]

Informazioni sul traffico sulle mappe di Yahoo

Yahoo ha aggiunto a maps.yahoo.com (mappe per USA e Canada) la possibilità di vedere in sovraimpressione dati sul traffico in tempo reale. Speriamo arrivi presto anche in Italia, e che sia consultabile via cellulare [via John Battelle].

Yahoo! Video Search e Media RSS

Novità da Yahoo! su ricerca e syndication multimediale:

  • Yahoo! Video Search, il motore di ricerca per video in rete. Layout essenziale, chiaramente ispirato a Google Images;
  • Yahoo! Media Rss, una espansione alle enclosures di RSS 2.0 per permettere di includere nei feed RSS file multimediali con più url per lo stesso file (ad esempio per offrire diversi encoding, diverse risoluzioni), più metadata e link ad un player (per supportare formati sconosciuti all’aggregatore e controllare l’ambiente di playback). Utile per espandere le funzionalità relative al podcasting e al broadcatching.

Update: un articolo su Yahoo! Search Blog spiega che le estensioni Media RSS sono state sviluppate per permettere a chi pubblica contenuti video di renderli più “amichevoli” per i motori di ricerca.

Le stranezze dei cercatori

Interessante gioco suggerito da Inside Google: Google Suggest suggerisce le ricerche in base alle ricerche più popolari effettuati da altri, con lo stesso prefisso della frase digitata. Così facendo offre una eccezionale finestra nelle mente collettiva di chi fa ricerche su Internet.

Purtroppo, l’immagine che ne risulta non è incoraggiante.

Tra le ricerche più popolari con prefisso “Where are my …”, ci sono “Where are my keys” e “Where are my children”.

Mi preoccupa il pensiero che le persone che chiedono a Google dove siano le loro chiavi o i loro bambini siano così tante da rendere queste le più popolari ricerche su “Dov’è X”.

[Via Inside Google]

P.S. Ancora più inquietanti sono le persone che chiedono a Google foto della propria moglie o fidanzatacercano su Google foto amatoriali di mogli e fidanzate altrui (grazie della correzione, Michele!): i suggerimenti #1 e #2 per “pics of my …” sono “pics of my wife” e “pics of my girlfriend”.

P.P.S. Il suggerimento più triste è quello che viene fuori quando si digita “when am I” …

Mappe delle città Europee su Google

Piano-piano, Google diventa locale anche in Europa. Cercando un nome di città, prima della lista dei risultati di ricerca vengono un paio di notizie locali, poi i link alle mappe della città (su ViaMichelin e Map24).

Link alle mappe di Google

Come osserva Inside Google, ViaMichelin è un pò troppo ficcanaso (5 domande e molti cookies), mentre Map24 fa meno domande e ha una interessante animazione della zoomata sulla mappa.

Microsoft Desktop Search

Dò anch’io il mio contributo alla popolarità odierna della beta di MSN Toolbar Suite, annunciata ieri, che ha già accumulato oltre 160 link sui weblog in giro per il mondo.

La Toolbar Suite integra uno strumento di ricerca per i file all’interno del proprio PC, che ha come punto di forza l’integrazione con IE, MSN Messenger e Outlook. E la dis-integrazione con Firefox, Thunderbird, ecc., uno può immaginare, vista la scritta in rosso che avvisa della “mancanza di requisiti minimi” chi visiti la pagina web della Toolbar Suite con un browser open source.

Il dirigente di Microsoft che presenta la Toolbar Suite vanta anche il suo maggior rispetto per la privacy rispetto ai software rivali: non terrebbe memoria delle pagine web che l’utente visita. A mio parere questa è una scelta discutibile: la funzione di ricerca all’interno delle pagine web che si sono visitate potrebbe essere molto utile. Chi la vuole la dovrebbe poter usare, mentre chi ha paura che mamma/moglie/fidanzata scopra eventuali visite web imbarazzanti, se la disabiliti. Non tenere memoria delle visite web è la scelta facile.

Piuttosto, Microsoft potrebbe offrire un Private Explorer, che faciliti l’eliminazione delle tracce dal browser …

Google University Library

John Battelle ha lo soop sul progetto di Google per digitalizzare i contenuti di alcune delle più importanti biblioteche del mondo e rendere possibile fare ricerche tramite computer dei loro contenuti.

Al progetto pilota partecipano diverse delle università più famose del mondo, tra cui Harvard, Oxford e Stanford (dove studiavano i fondatori di Google). Inizialmente verrà digitalizzata solo una parte dei volumi presenti nelle biblioteche (solo quella di Harvard dispone di 15 milioni di volumi), ma se avrà successo, dovrebbe estendersi a gran parte dei volumi presenti.

Per i libri nel pubblico dominio sarà possibile l’accesso al testo integrale, per i libri ancora sotto copyright dovrebbe essere possibile solo l’accesso agli spezzoni intorno ai risultati delle ricerche effettuati.

Questo progetto, assieme al progetto analogo di Amazon.com potrebbe aggiungere alla rete un importante segmento della conoscenza umana, rivoluzionando sia il modo in cui è possibile avere accesso a quei volumi (prima condizionato all’accesso fisico alle biblioteche in cui erano rinchiusi), sia il modo in cui si possono fare ricerche all’interno dei volumi stessi. Se poi in futuro sarà possibile linkare i contenuti dei libri dall’esterno, le cose diventano ancora più interessanti …

Il progetto inizialmente doveva chiamarsi Google Library, poi è stato deciso che farà parte di Google Print. C’è curiosità sui modi in cui Google monetizzerà il servizio Google Print (pubblicità contestuale sulle pagine di ricerca ? una percentuale sui libri venduti tramite Google Print ? stampa on-demand di libri nel pubblico dominio ?).

Copernic

Va molto di moda il desktop search, in questo momento. Mi hanno parlato molto bene di Copernic, che pare verrà adottato da AOL come strumento di desktop search.