Tecnologia database per lanalisi di log file di Web server Relatore: Prof. Daniele Montanari Correlatore: Prof. Sonia Bergamaschi Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Candidato: Tania Farinella
Software di analisi Database WebTrends Analog Stream
Memorizzazione completa Formato dei file Massima flessibilità Formato dei file di log Common Log File Format Extended Log File Format
Common Log File Format remotehost rfc 931 auth_user [data] richiesta " GET /index.htm HTTP/1.0 " stato byte jo [15/Sep/2005:16:23: ] jo[15/Sep/2005:16:23: ] " GET /index.htm HTTP/1.0 "
Pre-elaborazione formatoLog File log Formato elaboraLog classiLog File Client File Protocollo File Data File Url Common Log File Format: %h %l %u %t \"%r\" %>s %b "GET /index.htm HTTP/1.0" GET|/index.htm|HTTP/1.0
Database
General Summary = sum ( ( dimL as bigint ) ) from Linea where dimL <> '-' and ( ( statoL > = 200 and statoL < 300 ) or statoL = 304 )
Report specifici Resoconto dei tipi di file
Sessioni Utente Elementi distintivi Pagina Dispositivo Autenticazione Tipo di documento Elenco Software Time out
Sessioni UtenteClientAccount Paginahtml/htm UtentePrima paginaUltima paginaNum. Pagine nick10/collegamenti/link.htm/index.html jo23/guestbook.htm/home.html create view pagine (nomeU,tipoU,dominioU,errU) as select * from url where (tipoU='html' or tipoU='htm')
Percorsi /lezioni/ /lezioni/informatica.htm / lezioni/elettronica.htm /lezioni/matematica.htm /docenti.asp /studenti.html nodo /lezioni/ /lezioni/informatica.htm / lezioni/elettronica.htm /lezioni/matematica.htm /docenti.asp /home/ nodo /studenti.html
Risultati Efficienza Flessibilità Resoconto generale, report specifici Sessioni, percorsi Nuove analisi
Prossimi lavori Grafica Formati Sessioni Percorsi Profili utenti