Viktor Kvaternjak

Entropijski file carving

Zadatak

Svrha diplomskog zadatka je poboljšati postupak rekonstrukcije uništenih ili djelomično oštećenih datoteka na digitalnim medijima. Potrebno je analizirati i klasificirati svojstva poznatih i dobavljivih računalnih alata za forenziku digitalnih medija. Obratiti pažnju na sastavljanje fragmenata i identifikaciju vrste sadržaja datoteke. Ispitati mogućnost korištenja nekih naprednih algoritama, poput entropijskih mjera.



Plan rada

Koraci su sljedeći:

  1. Proučiti NIST dokument u kojemu propisuju 15 testova za provjeru nasumičnosti
  2. Implementirati svih 15 testova
  3. Uzeti par tipova datoteka (PDF, PNG, video, txt) koji imaju različit tip sadržaja i pokrenuti algoritme da se vidi kako radi
  4. Napraviti feature vector od tih 15 testova
  5. Pomoću tog feature vectora napraviti skup za treniranje od N datotekaa za svaki tip datoteke
  6. uzeti Java-ml (ili neku drugu AI library) i probati učitati training set i napravit klasifikaciju za nove datoteke
  7. napraviti nekoliko scenarija gdje se datoteka djelomično obriše (na binarnoj razini) i ponoviti prepoznavanje

Rezultat

Zaključak

Prijedlog za daljnje istraživanje