U okviru projekta potrebno je u programskom jeziku php izvesti program koji će uspoređivati tekstualni zapis na hrvatskom jeziku s postojećim skupom zapisa i ocijeniti njegovu jedinstvenost.
Pretpostaviti da su dostupni ulazni podaci:
datoteka s popisom do sad primljenih tekstualnih zapisa
novi tekstualni zapis
dodatni elementi koji mogu pomoći u rješavanju problema (npr. riječnik, sažetak ili indeks postojećih pojmova, …?)
Kao izlazni podatak program treba moći vratiti:
informaciju o najvećem postotku sličnosti trenutnog zapisa s nekim od postojećih kao i popis takvih zapisa
informaciju je li trenutni zapis jedinstven uz zadani prag sličnosti (postotak koji zadaje korisnik)
?
Posebno uzeti u obzir i optimizirati brzinu obrade podataka.
Dnevnik rada