1. Johdanto
2. Järjestelmän käyttöönotto
3. Toiminnot
4. Ongelmatilanteet
5. Ylläpito
6. Liitteet
7. Kirjallisuusviitteet
8. Sanasto
9. Hakemisto
ConfigurationFile.txt: hyväksytyt tokenit | |
TrashFilter | Yksi rivi, regular expression, joka sisältää algoritmin pois filtteröittävät tiedostonimet, kuten inline-kuvat jne. |
SectionRules | Www-palvelimen "section"it eli erilliset osastot sillä tarkkuudella kuin ne halutaan erotella toisistaan klusteroitaessa. Eri osastot ovat eri riveillä jokainen omana regular expressioninaan. |
IntervalsAveragePathLength
IntervalsMegaUserPerHit IntervalsMegaUserPerSession IntervalsVisitStartTimeFrequency IntervalsSessionPathLengthFrequency IntervalsSessionLengthFrequency |
Klusterointialgoritmin tarvitsema intervallivälit,
rivi pilkuilla toisistaan eroteltuja integerejä
Esim. 0,3,10,20 tarkoittaa intervalleja [0-3],[3-10],[10-20],[20...] |
DBPort ClusterDB
DBPort UserDB DBPort LogDB |
Ohjelmiston käyttämien tietokantojen portit (proto olettaa vielä kantojen olevan samassa koneessa) |
VisitThreshold | Yksittäinen Integer, aika, jonka pituinen hiljainen jakso erottaa kaksi erillistä sessiota. |
MaxNumOfLogUsers | Integer, määrittää montako käyttäjää kerrallaan haetaan tietokannasta. Parametrilla voi vaikuttaa toiminnan tehokkuuteen, käytännössä optimaalinen arvo riippuu tietokantatoteutuksesta ja yhteyksistä tietokantaan. |
Components | Klusterointialgotimin hyväksymät komponentit, jokainen, joka
halutaan tähän klusterointiin mukaan, kirjoitetaan omalle rivilleen
Components-osaan. Hyväksytyt komponentit ovat:
SectionFrequency MostFrequentlyVisitedSection SecondMostFrequentlyVisitedSection StartSectionFrequency MostFrequentPathStart StopSectionFrequency MostFrequentPathEnd SessionPathLengthFrequency MostFrequentPathLength AveragePathLength MegaUserPerHit MegaUserPerSession HourFrequency DayFrequency WeekEndFrequency SessionLengthFrequency MostFrequentLength VisitStartTimeFrequency |
Klusteroinnin aloitusdialogi koostuu kolmesta välilehtien tapaan toteutetusta runnakkaisesta osasta, joista jokaista vastaa yksi dialogin ylälaidassa oleva toimintonäppäin. 'Ajo'-kenttä, joka avautuu ensiksi, on esitetty kuvassa 2. Tähän kenttään voidaan syöttää ko. ajolle kuvaava nimi sekä se, kuka klusteroinnin on tehnyt. Lokidataa voi käsitellä sen mukaan, keitä käyttäjistä halutaan mukaan tämänkertaiseen klusterointitarkasteluun. Periaatteena on, että oletuksena tutkitaan kaikkia käyttäjiä, mutta klusteroinnin laatija voi tarpeen mukaan suodattaa osan käyttäjistä pois (tai oikeastaan suodattaa lokidatasta pois näiden käyttäjien tekemäät haut). Suodatuksen hallintaan on laadittu oheinen dialogi: