Soubor v informatice označuje pojmenovanou sadu dat uloženou na nějakém datovém médiu, se kterou lze pracovat nástroji operačního systému jako s jedním celkem.
Obsahem souboru mohou být různá data. Mnoho souborů reprezentuje jediný objekt a obsahuje jenom jeden druh dat (například textový dokument, počítačový program, obrázek, zvukový záznam), ale existují i soubory složené (archivní soubory, knihovny, ISO obrazy disků), které obsahují množství dílčích objektů a souborů; také kancelářské dokumenty mohou obsahovat vložené objekty (např. obrázky a tabulky), u multimediálních i jiných souborů mluvíme o kontejnerech, které mají vlastní formát a mohou obsahovat několik objektů (obraz, zvuk, titulky) různých formátů, přičemž formát jednotlivých složek není příliš závislý na formátu kontejneru. Podle toho, jak má být obsah souboru interpretován lze soubory rozdělit na textové a binární.
Fyzické uspořádání souborů na datovém médiu je závislé na použitém souborovém systému (anglicky filesystem [ˈfaɪlsɪstəm]IPA). Starší operační systémy podporovaly různé organizace souborů (sekvenční, indexované, index-sekvenční, s přímým přístupem, členěné, zvláštní organizace textových souborů), což vedlo k problémům s interoperabilitou a přenositelností a k nutnosti používat komplikované nástroje pro práci se soubory. Většina moderních operačních systémů pod vlivem Unixu považuje soubor za posloupnost znaků, které reprezentují informace uložené v onom souboru,[1] přičemž další interpretaci přenechává na aplikačních programech nebo knihovnách.
<ref>
; citaci označené jelenovo
není určen žádný text