Turismo 3.0 Challenge

dati-trentino-74342

Sponsor: dati.trentino.it

Il servizio Supporto alla direzione generale e ICT - Progetto Open data in Trentino - è la struttura responsabile del portale federato opendata dati.trentino.it

I dati vengono pubblicati sul portale seguendo il principio del best effort, cioè fornire la massima qualità possibile date le risorse disponibili. I dataset, quindi, possono essere costantemente migliorati ed arricchiti.

La visualizzazione dei dati sulle mappe è un passaggio importante per permettere di programmare delle visite/viaggi/vacanze da remoto e, per chi sia fisicamente in un luogo in un dato momento, per trovare informazioni che interessano circa risorse e attività interessanti nei dintorni.

Vi chiediamo quindi di arricchire i dataset degli agritur e degli esercizi alberghieri con le coordinate geografiche delle strutture, usando tecniche di georeferenziazione. Inoltre, potreste realizzare un prototipo di motore di ricerca per alberghi e agritur, che permetta di visualizzare i risultati su una mappa.

La georeferenziazione si può effettuare usando servizi offerti da OpenStreetMap, la mappa di tutto il mondo realizzata da volontari. La ricerca dovrebbe permettere di filtrare le strutture in base a diversi criteri (n. camere, servizi come parcheggio, prima colazione, etc ). Per ordinare i risultati della ricerca ponendo per prime le strutture più rilevanti, si potrebbe provare ad ordinarle secondo la reputazione. Si potrebbe calcolarla considerando diversi fattori come la data di inizio attività, o il numero follower sui social come Twitter: tali informazioni vi saranno fornite da Atoka, il motore di ricerca per aziende di SpazioDati.

Dataset:

  • dataset sulle strutture alberghiere su dati.trentino.it

  • dataset agritur su dati.trentin.it

  • dataset Atoka

a. Analisi

  • Quanti turisti ci sono in Trentino che possono essere interessati al nostro servizio ?

  • Quali e quante imprese possono essere interessate a contattare strutture alberghiere e agritur ? Esempi:

    • i produttori di alimentari trentini possono voler rifornire agritur vicini

    • imprese assicurative possono voler vendere assicurazioni anti-incendio / furto agli alberghi

b. Integrazione

  • i dati spesso provengono da varie fonti e vanno integrati, per esempio i dati sugli alberghi possono avere un formato diverso da quelli degli agritur

c. Arricchimento

A volte i dati desiderati non sono immediatamente reperibili dalle tabelle iniziali e vanno ricavati in altro modo.

Consideriamo le coordinate geografiche:

  • il dataset degli agritur ha le colonne, ma sono vuote

  • il dataset degli alberghi non ha nemmeno le colonne per latitudine e longitudine

  • il dataset di Atoka ha spesso le coordinate, ma in alcuni casi non sono presenti

Potremmo ricavare le coordinate mancanti usando servizi di geocoding di OpenStreetMap

Per esempio, l’Hotel La Gioiosa di Riva del Garda non è in Atoka ma lo troviamo su OpenStreetMap :

https://www.openstreetmap.org/search?query=HOTEL%20LA%20GIOIOSA%20#map=19/45.91066/10.83929

Partita IVA e CCIA

il modo più preciso per identificare un’azienda in Italia è tramite la partita IVA. Il dataset delle strutture alberghiere ce l’ha, ma in quello degli agritur invece troviamo il codice CCIA, che è un identificativo unico all’interno delle aziende iscritte in un’unica Camera di Commercio. Sarebbe quindi interessante aggiungere l’IVA agli agritur, per esempio cercando di incrociare la tabella con informazioni da Atoka

d. Ricerca

Dovremmo mostrare per primi i risultati più rilevanti. L’ordinamento (ranking) si può costruire considerando nella formula fattori come:

  • la data di inizio attività

  • il numero di dipendenti

  • numero di link al proprio sito

  • follower sui social come twitter.

Per usare tali dati, occorrerà incorciare i dati degli agritur e strutture alberghiere con il dataset estratto da Atoka, il servizio per aziende di SpazioDati.

Dati agritur

Su dati trentino c’è un dataset degli agritur in formato csv, che ha gli indirizzi ma non le coordinate geografiche. Si potrebbe ottenere le coordinate geografiche usando OpenStreetMap e poi mettere gli agritur su una mappa. Questa procedura è già stata fatta in un tutorial sul sito di softpython e in versione semplificata senza python con solo Google Spreadsheet e MapQuest API sul sito di CoderDojo Trento

Dati strutture alberghiere

Su dati trentino c’è un dataset sulle strutture alberghiere in formato XML che però non ha le coordinate geografiche. Si potrebbe ottenerle con OpenStreetMap e poi riportarle su una mappa, sul modello del tutorial per gli agritur

Per avere un idea di come estrarli in Python, guardare il tutorial Estrazione dati su softpython. Volendo, si possono anche convertire in CSV con il sito convertcsv.com

DOMANDA: Se hai dei dati privati contenti informazioni sensibili dei clienti che non vuoi assolutamente pubblicare e/o cedere a terze parti, useresti un servizio web ‘gratuito’ qualunque per convertirli? Sai che uso verrà poi fatto di quei dati?

Dataset agritur Atoka

Questo dataset è fornito da SpazioDati tramite il servizio Atoka . Riportiamo qui un esempio dei dati (in verticale).

Per i dati completi chiedere a david.leoni@unitn.it

agritur-atoka-8912312

Dataset hotels Atoka

Questo dataset è fornito da SpazioDati tramite il servizio Atoka . Riportiamo qui un esempio dei dati (in verticale).

hotels-atoka-8123123

Per i dati completi chiedere a david.leoni@unitn.it

[ ]: