Turismo 3.0 Challenge¶
Sponsor: dati.trentino.it
Il servizio Supporto alla direzione generale e ICT - Progetto Open data in Trentino - è la struttura responsabile del portale federato opendata dati.trentino.it
I dati vengono pubblicati sul portale seguendo il principio del best effort, cioè fornire la massima qualità possibile date le risorse disponibili. I dataset, quindi, possono essere costantemente migliorati ed arricchiti.
La visualizzazione dei dati sulle mappe è un passaggio importante per permettere di programmare delle visite/viaggi/vacanze da remoto e, per chi sia fisicamente in un luogo in un dato momento, per trovare informazioni che interessano circa risorse e attività interessanti nei dintorni.
Vi chiediamo quindi di arricchire i dataset degli agritur e degli esercizi alberghieri con le coordinate geografiche delle strutture, usando tecniche di georeferenziazione. Inoltre, potreste realizzare un prototipo di motore di ricerca per alberghi e agritur, che permetta di visualizzare i risultati su una mappa.
La georeferenziazione si può effettuare usando servizi offerti da OpenStreetMap, la mappa di tutto il mondo realizzata da volontari. La ricerca dovrebbe permettere di filtrare le strutture in base a diversi criteri (n. camere, servizi come parcheggio, prima colazione, etc ). Per ordinare i risultati della ricerca ponendo per prime le strutture più rilevanti, si potrebbe provare ad ordinarle secondo la reputazione. Si potrebbe calcolarla considerando diversi fattori come la data di inizio attività, o il numero follower sui social come Twitter: tali informazioni vi saranno fornite da Atoka, il motore di ricerca per aziende di SpazioDati.
Dataset:
dataset sulle strutture alberghiere su dati.trentino.it
dataset agritur su dati.trentin.it
dataset Atoka
a. Analisi¶
Quanti turisti ci sono in Trentino che possono essere interessati al nostro servizio ?
Quali e quante imprese possono essere interessate a contattare strutture alberghiere e agritur ? Esempi:
i produttori di alimentari trentini possono voler rifornire agritur vicini
imprese assicurative possono voler vendere assicurazioni anti-incendio / furto agli alberghi
b. Integrazione¶
i dati spesso provengono da varie fonti e vanno integrati, per esempio i dati sugli alberghi possono avere un formato diverso da quelli degli agritur
c. Arricchimento¶
A volte i dati desiderati non sono immediatamente reperibili dalle tabelle iniziali e vanno ricavati in altro modo.
Consideriamo le coordinate geografiche:
il dataset degli agritur ha le colonne, ma sono vuote
il dataset degli alberghi non ha nemmeno le colonne per latitudine e longitudine
il dataset di Atoka ha spesso le coordinate, ma in alcuni casi non sono presenti
Potremmo ricavare le coordinate mancanti usando servizi di geocoding di OpenStreetMap
Per esempio, l’Hotel La Gioiosa di Riva del Garda non è in Atoka ma lo troviamo su OpenStreetMap :
https://www.openstreetmap.org/search?query=HOTEL%20LA%20GIOIOSA%20#map=19/45.91066/10.83929
Partita IVA e CCIA¶
il modo più preciso per identificare un’azienda in Italia è tramite la partita IVA. Il dataset delle strutture alberghiere ce l’ha, ma in quello degli agritur invece troviamo il codice CCIA, che è un identificativo unico all’interno delle aziende iscritte in un’unica Camera di Commercio. Sarebbe quindi interessante aggiungere l’IVA agli agritur, per esempio cercando di incrociare la tabella con informazioni da Atoka
d. Ricerca¶
Dovremmo mostrare per primi i risultati più rilevanti. L’ordinamento (ranking) si può costruire considerando nella formula fattori come:
la data di inizio attività
il numero di dipendenti
numero di link al proprio sito
follower sui social come twitter.
Per usare tali dati, occorrerà incorciare i dati degli agritur e strutture alberghiere con il dataset estratto da Atoka, il servizio per aziende di SpazioDati.
Dati agritur¶
Su dati trentino c’è un dataset degli agritur in formato csv, che ha gli indirizzi ma non le coordinate geografiche. Si potrebbe ottenere le coordinate geografiche usando OpenStreetMap e poi mettere gli agritur su una mappa. Questa procedura è già stata fatta in un tutorial sul sito di softpython e in versione semplificata senza python con solo Google Spreadsheet e MapQuest API sul sito di CoderDojo Trento
Dati strutture alberghiere¶
Su dati trentino c’è un dataset sulle strutture alberghiere in formato XML che però non ha le coordinate geografiche. Si potrebbe ottenerle con OpenStreetMap e poi riportarle su una mappa, sul modello del tutorial per gli agritur
Per avere un idea di come estrarli in Python, guardare il tutorial Estrazione dati su softpython. Volendo, si possono anche convertire in CSV con il sito convertcsv.com
DOMANDA: Se hai dei dati privati contenti informazioni sensibili dei clienti che non vuoi assolutamente pubblicare e/o cedere a terze parti, useresti un servizio web ‘gratuito’ qualunque per convertirli? Sai che uso verrà poi fatto di quei dati?
Dataset agritur Atoka¶
Questo dataset è fornito da SpazioDati tramite il servizio Atoka . Riportiamo qui un esempio dei dati (in verticale).
Per i dati completi chiedere a david.leoni@unitn.it
Dataset hotels Atoka¶
Questo dataset è fornito da SpazioDati tramite il servizio Atoka . Riportiamo qui un esempio dei dati (in verticale).
Per i dati completi chiedere a david.leoni@unitn.it
[ ]: