Strukturirano proti nestrukturiranemu
Strukturirani in nestrukturirani sta dve vrsti podatkov ali informacij, ki kažeta razlike med njima, ko gre za koncepte in pomene. Opis podatkov v poljih se imenuje strukturirane informacije. Po drugi strani pa se vsi binarni dokumenti imenujejo nestrukturirane informacije ali podatki. To je glavna razlika med strukturiranim in nestrukturiranim.
Strukturirane informacije se imenujejo tako, ker je njihova narava in funkcija prepoznana z metapodatkovnimi oznakami. Po drugi strani pa sta nekaj najboljših primerov dokumentov, ki spadajo med nestrukturirane vrste podatkov ali informacij,.pdf in.docx.
Pomembno je vedeti, da imajo strukturirane informacije velik del SharePointa. Rečeno je, da se vsa vsebina, proizvedena ali ustvarjena neposredno v SharePointu ali znotraj njega, šteje za strukturirano. Na primer, vsi seznami območij in elementi seznama, ki so ustvarjeni ali proizvedeni neposredno v SharePointu, spadajo pod strukturirano vrsto podatkov ali informacij. To je pomembna ugotovitev, ko gre za definiranje strukturiranih podatkov.
Ne smemo pozabiti, da vsi binarni dokumenti, ki uporabljajo lastniške aplikacije, kot sta Acrobat ali Word, spadajo med nestrukturirane vrste podatkov ali informacij. Pravzaprav se nestrukturirane informacije samodejno ekstrahirajo s pomočjo aplikacije IFilter ali ustreznega pretvornika. To je še ena pomembna razlika med strukturiranimi in nestrukturiranimi podatki.
Seveda si je treba zapomniti, da se reference SharePoint primarno uporabljajo samo za indeksiranje strukturiranih podatkov. Ne uporablja se za druge namene. Jasno razumevanje razlike med strukturiranimi in nestrukturiranimi podatki ali informacijami je za strokovnjaka za programsko opremo nujno v smislu, da bo lahko pravilno kategoriziral datoteke in podatke.