Korisnički alati

Site alati


studenti:viktor_kvaternjak:izvjesce1lipnja

Opis okoline

Izrađena je CSV datoteka s podacima za učenje.

Primjer datoteke:

0.020750,0.397349,0.093680,0.095192,0.091558,0.095130,0.070817,0.808820,0.323488,0.585612,0.013106,0.032234,0.211226,JPG
0.036282,0.131566,0.058351,0.001613,0.007259,0.003279,0.168669,0.959480,0.119376,0.125695,0.032234,0.062128,0.093143,JPG
0.013559,0.126013,0.080064,0.274000,0.231599,0.039639,0.128541,0.676648,0.041617,0.012520,0.020784,0.015086,0.925766,JPG

Redci te datoteke su rezultati izvođenja testova na blokovima od 4096 bajta podataka. Prvi blok svake datoteke se preskače (header). Stupci te datoteke su 13 testova (float brojevi) te poseban stupac koji označava kategoriju.

Ta datoteka se učita i njome se istrenira klasifikator K najbližih susjeda. Nakon toga je klasifikator spreman za klasificiranje nepoznatih podataka.

Cross-validation klasifikatora

Ocjenu rada klasifikatora možemo dobiti i iz samih podataka korištenih za učenje. Korišten je 10-fold cross validation.

Klasifikator je pokazao da su mu točnosti sljedeće (postotak točno klasificiranih).

JPG: 0.78
MP3: 0.83
TXT: 0.93
RAR: 0.80
PDF: 0.74
PNG: 0.86

Rezultat rada nad nepoznatom datotekom

Slijede prikazi rada nad pojedinim nepoznatim datotekama. Svaki blok datoteke (4K) je klasificiran, a rezultati su sljedeći:

MP3 datoteka

JPG: 271 TXT: 193 MP3: 872 RAR: 22 PDF: 790 PNG: 80 Točno klasificirano.

PNG datoteka

JPG: 4 TXT: 5 MP3: 9 RAR: 2 PDF: 20 PNG: 6 Netočno klasificano.

TXT datoteka

JPG: 4 TXT: 392 MP3: 103 RAR: 1 PDF: 3 Točno klasificirano.

JPG datoteka

JPG: 111 TXT: 8 MP3: 47 RAR: 80 PDF: 71 PNG: 16 Točno klasificirano.

RAR datoteka

JPG: 46 MP3: 18 TXT: 5 RAR: 50 PDF: 42 PNG: 8 Točno klasificirano.

PDF datoteka

JPG: 32 TXT: 37 MP3: 66 RAR: 15 PDF: 78 PNG: 17 Točno klasificirano.

studenti/viktor_kvaternjak/izvjesce1lipnja.txt · Zadnja izmjena: 2023/06/19 18:21 (vanjsko uređivanje)