Us heu entretingut mai a llegir tot el contingut d’una URL? Sabíeu que fent-ho podeu aprendre moltes coses? La següent URL correspon a una cerca real (amb petites modificacions per no comprometre ningú) a una pàgina d’una companyia aèria a la qual s’ha accedit a través d’un anunci a Internet:

url companyia aeria

Com podeu veure es tracta d’una tira molt llarga, però si la trossegem n’obtindrem informació molt valuosa. El primer que trobem és https://www.airline.com, que és el web de la companyia aèria. Després d’això hi trobem un interrogant (?) que separa el nom del web de tota una llista de paràmetres que van separats entre si per ets (&). Fixeu-vos-hi que cadascun d’aquests paràmetres té el format nom=valor. Vegem quina informació ens dóna cadascun dels paràmetres de la URL anterior:

  1. country=ES
    Aquest paràmetre ens indica que estem a la versió de la pàgina dirigida a l’Estat espanyol.
  2. language=ca
    Estem utilitzant la versió en català de la pàgina web.
  3. trip_type=2
    Encara que no és evident, aquest nombre indica que hem triat un vol d’anada i tornada. Segurament un vol de només anada s’indicaria amb un 1.
  4. begin_date=20170307
    La data que hem triat per a l’anada és el 7 de març de 2017.
  5. end_date=20170315
    La data que hem triat per a la tornada és el 15 de març de 2017.
  6. origin=BCN
    Volem sortir des de l’aeroport de Barcelona.
  7. destination=ROM
    Volem arribar a l’aeroport de Roma.
  8. adults=2
    Hem buscat bitllets per a dos adults.
  9. children=1
    Aquests dos adults viatgen amb un nen.
  10. fare_type=regular
    Hem triat una tarifa regular. Segurament un altre valor vàlid del paràmetre seria business.
  11. utm_source=google
    L’anunciant a través del qual hem accedit al web és Google adwords.
  12. utm_medium=gdn
    L’anunci correspon concretament a la xarxa visual de Google o Google Display Network (GDN). Altres valors vàlids podrien ser gmail per a un anunci rebut en un e-mail o cpc (cost per click) per a un anunci que aparegui en un cercador.
  13. utm_campaign=winter_promo
    L’anunci correspon a una promoció especial que s’està fent durant els mesos d’hivern.
  14. tracker=asdf123
    L’anunci conté un element de seguiment amb un codi especial.

Fixeu-vos-hi que els 10 primers paràmetres en realitat no diuen gaire cosa que no sabéssim, ja que les dates dels vols, on volem viatjar o quanta gent serem és informació que hem aportat nosaltres mateixos. Els paràmetres 11, 12 i 13 ja són, en canvi, més interessants: es tracta de paràmetres tipus Urchin Traffic Monitor (UTM), que els anunciants fan servir per tenir informació de la cerca que s’ha realitzat. En particular els UTM són totalment compatibles amb Google Analytics, l’eina d’anàlisi web de Google. L’últim paràmetre també és molt interessant, ja que ens indica la presència de tercers que estan recollint informació de la cerca. Aquesta informació gairebé amb tota seguretat s’utilitzarà per obtenir estadístiques i per a finalitats comercials.

Entendre bé les URL ens pot permetre saber moltes coses i també saber quines coses es coneixen de nosaltres. En l’exemple tots els paràmetres tenen noms molt transparents, però això no sempre passa, això no és sempre així. Un bon exercici quan navegueu per Internet es provar de canviar manualment paràmetres de la URL i veure com afecten a la pàgina en què us trobeu.

Per cert: algú coneix alguna manera, eina o estratègia per evitar que recullin informació sobre nosaltres en un cas com el que hem explicat? Per què no us hi atreviu, deixant un comentari a sota d’aquesta mateixa entrada o bé a la piulada i  a l’apunt de Facebook associats? En qualsevol cas, nosaltres us ho explicarem al proper article sobre Qui et segueix?

Vols seguir-nos?