O parte a numelui fișierului este una dintre literele sh. Nume de fișiere pe diferite sisteme. Limitări privind numele fișierului și lungimile căilor

După ce a întâlnit o frază de neînțeles, cititorul, de regulă, se străduiește să-i afle sensul. Acest articol este o scurtă excursie pentru utilizator în lumea necunoscutului.

Conceptul general de dosar

Stocarea pe termen lung stochează toate datele ca fișiere. Ce este? Un fișier este o secvență numită de octeți, care la rândul lor constau din biți. Are propriul nume și adresă de locație. Primul parametru este specificat de o persoană, iar al doilea este setat și reținut pentru o lungă perioadă de timp de sistemul de operare. Căutarea se efectuează după numele fișierului, deci nu este nevoie ca utilizatorul să-și noteze adresa.

Se întâmplă că informațiile nu pot fi găsite pe mediile computerizate. Dar chiar și dosar gol are propriul nume, care este o proprietate importantă a setului de date înregistrat pe hard disk. Dacă este absentă, atunci o astfel de structură nu poate fi numită stocare.

Sistemul de fișiere

Fiecare (dischetă, hard sau laser) poate conține o cantitate imensă. Sistemul de fișiere este conceput pentru a stoca date și a organiza diverse directoare. Într-un sens larg, constă din totalitatea tuturor informațiilor de pe disc, seturi de structuri de date, un complex de sistem software. Directorul rădăcină este format din atașamente de nivel 2, care la rândul lor includ foldere de nivel 3 etc. Un singur nivel sistem liniar folosit pentru discuri cu mai multe fișiere, ierarhic pe mai multe niveluri - pentru discuri cu acestea o cantitate mare. Al doilea este caracterizat de o structură arborescentă.

Scopul sistemului de fișiere

Este pentru a asigura interfață convenabilă pentru o persoană atunci când accesează informații aflate pe disc și realizează posibilitatea partajarea obiecte de multe persoane și procese în desfășurare. Acest tip de structură vă permite să obțineți rezultate maxime atunci când lucrați cu date.

Tipuri de fisiere

Datorită anumitor informații, computerul poate „înțelege” aproximativ ce este în setul de date și ce program poate fi folosit pentru a-l deschide. Extensia este de câteva litere sau cifre după punctul în nume standard fişier. Acesta definește tipul de date și programul corespunzător. De exemplu, informațiile înregistrate pe un disc cu extensia mp3 se vor deschide în player. Imaginea programului este prezentă în imaginea fișierului. Prin această icoană utilizator avansatînțelege imediat unde poate fi aplicat tipul de date specificat. Documentul se va deschide numai într-un program conceput pentru text. Fișierele video pot fi redate în player. Informațiile sub formă de imagini se deschid în editor grafic. Există multe diverse fișiere. Fiecare dintre ele are o pictogramă care indică programul corespunzător.

Fișier: nume de fișiere

Utilizatorii dau setului de date de pe disc nume simbolice. Fișierele sunt identificate de ei. În acest caz, trebuie luate în considerare restricțiile de sistem atât asupra caracterelor utilizate, cât și asupra întregii lungimi a frazei. Numele fișierului este numele specificat mai sus, care poate fi același pentru mai multe seturi de date. În acest caz, secvența identificatorilor de director, adică adresa unde se află informațiile, va fi diferită. În unele sisteme, același obiect nu poate avea mai multe nume, în altele nu există deloc o astfel de restricție. În acest din urmă caz, setul de date primește un nume unic. Acesta este un identificator numeric folosit de orice program de sistem de operare.

Compoziția numelui fișierului

Orice informație de pe un disc conține mai multe elemente. În ce constă numele fișierului? Pentru a înțelege acest lucru, trebuie să aveți o probă în fața ochilor. Numele fișierului este format din două părți interdependente: numele și extensia, care determină tipul de date. Identifică orice informație de pe mediu.

Numele complet

Iată un exemplu:

C:\Music\Holiday\Melody.mp3.

Numele complet al fișierului indicat în eșantion este numele format din fișierul în sine și calea informațiilor. Ultimul dintre elemente specificate este o listă de identificatori de foldere care ar trebui deschise secvenţial pentru a ajunge de la cel mai înalt nivel la setul de date. Numele complet fișierul trebuie specificat pornind de la directorul rădăcină și conține o listă cu toate atașamentele dependente de alte niveluri. Acest nume este absolut. Se referă la informații referitoare la directorul rădăcină, indiferent de dosarul curent. Toate elementele de nume sunt separate printr-un caracter oblic (\). Acest caracter trebuie specificat înainte de numele directorului rădăcină.

Nume scurt

Constrângerile sunt motivul pentru care acest termen a luat ființă. În acele zile, un fișier putea avea doar 8 caractere în numele său. Puțin mai târziu, a devenit posibil să se pună un punct după nume și să se adauge 3 caractere de extensie.

Arăta așa:

Melodie.mp3.

Dezvoltatorii au început să folosească extensii de nume pentru nevoi tehnice. Cu ajutorul lor, programele au „învățat” să recunoască tipul de fișier. Această schemă de înregistrare a numelui de fișier a fost numită sistem 8.3 (după numărul de caractere din nume și extensie și o perioadă între ele). Avea o serie de dezavantaje: incapacitatea de a folosi spații, semne de punctuație și alte litere decât alfabetul englez. Prin urmare, crearea unui nume semnificativ a fost foarte dificilă. Numele scurt nu conține o bară oblică ( \ ). Prin acest nume vă puteți referi la datele din directorul curent.

Nume lung

Anterior, când mii de fișiere erau stocate pe discuri, utilizatorii știau destul de bine de unde provin anumite date de pe medii. În prezent, este imposibil să monitorizați istoricul informațiilor primite. Prin urmare, restricțiile stricte privind lungimea titlului au fost eliminate pentru date. În ce constă numele fișierului? Acum numele poate fi scris cu litere rusești, cu unele semne de punctuație și chiar spații. Extensia este indicată nu numai prin trei caractere. Dacă numele conține mai multe puncte, tipul fișierului este indicat după ultimul semn de punctuație.

Cu toate acestea, tradițiile conțin o mare putere, motiv pentru care extensiile lungi nu se găsesc pe computere. Trei caractere sunt suficiente pentru ca sistemul să indice tipul fișierului. Pot exista cel puțin 250 de caractere, deși acest lucru pare cu siguranță exagerat.

Obiecte problematice

Document cu nume lung este posibil să nu fie citit corect pe alt computer. Prin urmare, atunci când trimiteți date, ar trebui să utilizați litere latine. Este posibil ca alfabetul rus să nu fie pe computerul destinatarului și, în loc de fraze, va apărea un set de caractere de neînțeles. Pentru a organiza un sistem de stocare a fișierelor calculator personal utilizator sunt folosite orice litere.

Numele corect al fișierului

Poate consta din orice litere mari sau mici, un număr, un punct și o liniuță de subliniere. Utilizarea spațiilor nu este interzisă. Cu toate acestea, nu ar trebui să îl folosiți excesiv și, de asemenea, nu îl puneți la începutul numelui. Puteți include alte caractere în nume, cu excepția caracterelor rezervate (>< | ? * / \ : "). Расширение отделяется от названия последней правой точкой. Длина имени ограничивается 255 знаками. На самом деле utilizator obișnuit 20 de caractere sunt suficiente. Sistemul de operare nu face distincție între literele mici și mari într-un nume de fișier. Aceasta înseamnă că nu va fi posibilă salvarea a două elemente cu același nume scrise în majuscule diferite în același director. Iată cum ar putea arăta un exemplu de nume care se potrivesc: „Text.doc” și „TEXT.doc”.

Nume de fișier incorect

Pe lângă aceste restricții, există o interdicție privind utilizarea numelor de dispozitive rezervate.

Deci, PRN este o imprimantă. COM1-COM4 - dispozitive conectate la porturi seriale 1-4. AUX îndeplinește aceeași funcție ca COM1. LPT1-LPT4 sunt elemente atașate la porturi paralele 1-4 (imprimante), CON (consolă) pentru intrare - cu tastatura, pentru ieșire - cu ecran, NUL - cu un dispozitiv „gol”. Când utilizatorul încearcă să specifice un nume rezervat, sistemul afișează o eroare. De asemenea, este afișat un avertisment când sunt utilizate caractere interzise. Indică un nume de fișier nevalid. Informațiile înregistrate incorect despre un set de date nu sunt salvate, ci preiau valoarea anterioară.

Șablon de nume de fișier

Shell-urile sistemului de operare, precum și diferitele limbaje de programare, permit utilizatorului să caute nume și directoare pentru anumite grupuri. Toate fișierele sunt verificate pentru conformitate șablonul dat, dacă oricare dintre ele coincide cu standardul, atunci se ia în considerare, dacă nu, atunci se omite.

De ce este nevoie de un astfel de eșantion? Adesea trebuie să efectuați aceeași acțiune pe un întreg grup de fișiere. Acest lucru durează mai puțin decât accesarea fiecărui document individual. Șablonul de nume de fișier vă permite să selectați un grup care îndeplinește cerințele specificate din mulțime. Este folosit chiar și în recuperarea datelor.

Personaje speciale

Șablonul de nume de fișier este specificat folosind caractere speciale:

  • Un asterisc este un simbol pentru orice grup de caractere. Numarul lor nu conteaza. De exemplu, o stea este un șablon care se potrivește cu toate informațiile din catalog. Datorită comenzii *.mp3, puteți modifica orice fișier de același tip. Numele fișierelor care încep cu my și se termină cu .txt sunt evidențiate folosind modelul my*.txt. Modelul *2014* definește toate obiectele existente pe computer ale căror nume conțin grupul de caractere 2014.
  • este o desemnare pentru oricare un singur personaj. De exemplu, pentru sample-ul de muzică.??? date adecvate începând cu cuvântul specificat și având o extensie de trei Litere engleze. În șablonul na?e.txt, orice simbol poate fi folosit în locul semnului de întrebare standard.

Alte echipe

Există și alte reguli pentru compilarea mostrelor. Datorită includerii în echipă paranteza patrata() cu o listă valori posibile puteți face căutarea mai flexibilă. Dacă doriți să găsiți fișiere care încep cu litera t, fără a ține cont de majuscule, atunci modelul ar trebui să fie scris astfel: *. Când căutați date cu nume alfabetice, puteți crea un interval. Un șablon similar arată astfel: ?.jpg. Sistemul va găsi fișiere cu tipul de extensie specificat, ale căror nume constau din două caractere. Mai mult, prima literă k, l, y sau z nu face distincție între majuscule și minuscule.

Valoarea Shell

Mai multe mostre pot fi utilizate într-o singură probă. caractere speciale. Șabloanele sunt combinate cu multe comenzi: parcurgerea directoarelor, copierea fișierelor, căutarea etc. Totuși, acțiunile sunt efectuate nu cu șablonul, ci cu datele care se potrivesc cu acesta. Obiectele necesare sunt selectate de shell-ul de comandă.

Extinderea modelului este procesul de înlocuire a caracterului * cu o secvență consecventă de nume de fișiere.

Echipele individuale nu vor putea găsi niciodată semn specialîn lista parametrilor dvs. Deci, ce este responsabil pentru preluarea datelor? Shell-ul de comandă efectuează extinderea necesară a modelului în așa fel încât să fie listate toate numele fișierelor care se potrivesc cu modelul.

Măști de nume de fișier

Sunt utilizate în operațiuni de grup cu date. Masca este o secvență de caractere permisă în numele fișierelor, care poate conține, de asemenea, un semn de întrebare și un asterisc. Cu ajutorul acestuia, puteți șterge orice fișier temporar de pe computer. Numele fișierelor din comandă pot conține diferite denumiri. Un semn de întrebare marchează un caracter arbitrar, în timp ce un asterisc marchează o întreagă secvență. De exemplu, folosind comanda rm *mp3, puteți șterge toate fișierele care se termină cu acest fragment. Dacă trebuie să ștergeți toate datele dintr-un director, ar trebui să utilizați comanda rm *. Comanda funcționează aproape în același mod cu schimbarea unui caracter. Măștile de nume pot fi folosite și cu directoare.

Copiere problematică

Trecerea la nume lungi creează probleme de compatibilitate cu programele create anterior care folosesc fraze mici. Pentru ca aplicațiile să deschidă informații în conformitate cu structura de stocare adoptată anterior, sistemul de fișiere trebuie să fie capabil să ofere aliasuri scurte unice pentru datele care au nume complexe. Noile sisteme de operare acceptă nume lungi. Dar uneori utilizatorul întâmpină probleme neașteptate. Copierea fișierelor cu nume lungi poate fi dificilă.

În acest caz, chiar și crearea unei comenzi rapide nu va ajuta. De obicei, utilizatorul trebuie doar să redenumească fișierul și să încerce din nou. Alternativ, puteți arhiva datele, le puteți copia și despachetați. Dar ce să faci dacă în al sutelea subdirector în care se află fișierul necesar, numele fișierelor sunt atât de lungi din cauza căii scrise în ele?

Opțiuni de backup

Dacă metodele de mai sus nu funcționează, ar trebui pur și simplu să vă conectați unitate de rețea cu un clic butonul corect mouse-ul pe imaginea computerului și selectați o conexiune din meniul care apare. În acest caz, trebuie să specificați litera pentru media dorită și calea fișierului.

Ca ultimă soluție, utilizatorul poate folosi programul de copiere a nume lungi FAR 2.0 și chiar poate dezactiva Coșul de reciclare.

Atunci cel mai probabil te înșeli. Există reguli prin care nu puteți denumi un fișier cu orice nume, ca un obiect fizic obișnuit. Mai întâi, să clarificăm ce este un nume de fișier și cum este utilizat.

Conceptele de „cale” și „nume fișier”

Foarte des în literatura informatică termenii „cale” și „nume fișier” sunt utilizați sub sensuri diferite. De obicei, cuvântul „cale” se referă la adresa sau locația unui fișier, adică unitatea, folderul și subfolderele în care se află fișierul. Cu toate acestea, Microsoft și alții consideră că calea către un fișier include nu numai locația acestuia, ci și numele fișierului în sine. Și unii oameni înțeleg prin cuvântul „cale” doar numele fișierului și folderele în care se află, fără a specifica unitatea. Unii utilizatori cred că „nume fișier” nu include extensia. În acest articol, extensia face întotdeauna parte din numele fișierului. În exemplul de mai jos, calea către fișier este evidențiată cu albastru, iar numele fișierului este evidențiată cu roșu.
X:\dosar\subdosar\
fişier.extensie

Caractere și nume rezervate

Cele mai utilizate caractere sunt permise într-un nume de fișier. Numele fișierului nu trebuie să conțină „ < ” (semn mai puțin), „ > ” (semn mai mare), „ : ” (coloană), „“” ( ghilimele duble), "/" (bară oblică), "\" ( backslash), „|” (bară verticală), „?” (semnul întrebării), „*” (asterisc) și nu se poate termina cu un punct sau un spațiu. De asemenea, fișierele nu pot fi denumite nume rezervate dispozitive: CON, PRN, AUX, NUL, COM1, COM2, COM3, COM4, COM5, COM6, COM7, COM8, COM9, LPT1, LPT2, LPT3, LPT4, LPT5, LPT6, LPT7, LPT8, Și LPT9.

Limitări privind numele fișierului și lungimile căilor

Există restricții privind lungimea numelui fișierului și lungimea căii. Limita absolută a lungimii unui nume de fișier, inclusiv calea acestuia, este de 260 de caractere. Această limită se numește termen MAX_PATH. De fapt, în practică, limitele pentru nume sunt și mai mici din cauza unui număr de alte restricții. De exemplu, fiecare linie de la sfârșit trebuie să conțină așa-numitul caracter nul, care marchează sfârșitul liniei. Deși marcatorul de sfârșit de linie nu este afișat, acesta este socotit ca un caracter separat atunci când se calculează lungimea, ceea ce lasă disponibile 259 de caractere pentru numele și calea fișierului. Primele trei caractere din cale sunt folosite pentru a identifica unitatea (de exemplu, C:\). Acest lucru reduce limita pentru nume de foldere, subdosare și fișiere la 256 de caractere.

Numele obiectului (dosar sau fișier) este limitat la 255 de caractere. Această limită este valabilă numai dacă obiectul nu se află în interiorul unui folder. Deoarece atunci când un obiect se află în interiorul unui folder, suma lungimilor tuturor folderelor în care se află, a separatorilor și a numelui obiectului este limitată la 256 de caractere, limita de lungime a numelui obiectului în sine este mai mică de 255 de caractere.

Informații în memorie externa(adică, pe lângă RAM și ROM) este stocat în fișiere.

Fişier este o parte a memoriei numită într-un anumit fel. Aceasta este cantitatea de memorie externă concepută pentru a stoca același tip de memorie.

Anterior, era posibil să se numească un fișier doar cu litere și cifre latine, fără a utiliza semne de punctuație și în total nu mai mult de 8 caractere.

Acum aproape toate restricțiile au fost ridicate.

După numele fișierului există o extensie (necesară pentru a determina tipul și formatul fișierului). Punctul intră în el. Toate împreună (nume + punct + extensie) se numesc numele complet al fișierului.

Extensia vă permite să determinați dacă acest fișier este informații executabile (program) sau statice (-static?) (text, muzică, imagine).

Tipuri executabile:

*.exe (execute) – programe executabile pentru DOS și Windows.

*.COM (compact) – tip simplu fisier executabil pentru DOS, dar poate fi realizat și pe Windows.

*.bat (fișier batch) - un fișier text în MS-DOS sau Windows, care conține o secvență de comenzi destinate executării de către interpretul de comenzi.

Specificație – calea către numele complet al fișierului.

Se obține pe baza structurii ierarhice (dosare, directoare).

Director (director, folder) este o parte a memoriei denumită într-un anumit fel, în care se află numele altor fișiere și directoare de niveluri de imbricare superioare.

HDD poate fi împărțit în mai multe unități logice (C:, D:, E: etc.).

C:\Nume folder de primul nivel\Nivel 2\Nivel 3\...\...\......\*.*

De asemenea, puteți conecta la un fișier folosind o pictogramă, o comandă rapidă și nu doar introducând calea în linia de comandă.

Structura fișierului memorie.

Întrebarea 1. Sistem de fișiere. Organizarea muncii cu fișiere și directoare.

Stocarea informațiilor în memoria externă.

Sistemul de operare oferă stocarea informațiilor în memoria externă (pe dischete, hard disk și discuri laser) sub formă de fișiere.

Fişier– o zonă de memorie numită în care să stocați diverse informatii: text, grafică, sunet, video - date și programe.

Tipuri de fisiere

1. Text

2. Sunetul

3. Grafic

4. Fișiere video

5. Numeric

6. Software

Nume de fișier

Numele complet al fișierului necesar pentru a indica cu exactitate locația fișierului. Este format din două părți separate printr-un punct:

Nume propriu [.Extension]

De exemplu, document 1.doc.

Prenume poate conține:

1. De la 1 la 8 caractere (pentru MS-DOS)

2. De la 1 la 255 de caractere (pentru W-95).

Parte nume propriu fișierele pot include:

1. Litere mici și majuscule scrisori(pentru MS-DOS), precum și litere rusești (pentru Windows).

3. Câteva simboluri de serviciu:

Următoarele caractere nu pot fi folosite în numele fișierului: / \ * ? : | “ < >

Extensie(opțional) - indică tipul fișierului, care este determinat de informațiile stocate în acesta. Începe cu un punct și conține de la 1 la 3 caractere.

EXTENSIUNI

1. Fișiere text: .txt, .doc etc.

2. Fișiere grafice: .bmp, .pcx, .gif etc.

3. Fișiere de sunet: .wav, .mid, .snd etc.

4. Fișiere video: .avi, .gtw etc.

5. Fișiere numerice: .cos

6. Fișiere de program: .bat, .com, .exe.

Pentru a se organiza cautare rapida fișierul dorit pe disc, fișierele sunt combinate în grupuri - foldere (directoare). Fiecare folder are un nume unic. Cerințele pentru numele folderelor sunt aceleași ca și pentru numele fișierelor. Extensia din numele directorului (dosarului) nu este utilizată. Fișierele și folderele formează un „arboresc” de foldere, în care fiecare fișier și folder are propriul loc (nivel). Pentru a determina locația exactă a unui fișier, ar trebui să cunoașteți numele unității pe care se află ( A:, C: etc.), și secvența de foldere care trebuie deschise pe calea către folderul în care se află fișierul.

Arborele folderului.

Acasă Dosare Dosare Dosare Dosare FIȘIERE

Dosar Nivelul I Nivelul II Nivelul III Nivelul YI

directoare, deci „metodă”, „metodă” și „metodă” ar fi trei diferit nume.

Există mai multe caractere permise în numele fișierelor și directoarelor care trebuie utilizate cu precauție. Acestea sunt așa-numitele caractere speciale „*”, „\”, „&”, „< ", " >", "; ", " ( ", " ) ", " | ", precum și caracterele de spațiu și tab. Cert este că aceste personaje au sens special pentru orice coajă, așa că va trebui să se acorde o grijă deosebită pentru a se asigura că shell de comandă a tratat aceste caractere ca parte a numelui fișierului sau directorului. Despre semnificația specială a simbolului „-” pentru comenzi Linux deja discutat în prelegerea 2, s-a discutat și acolo cum să-și schimbe interpretarea 1 Simbol " - " înseamnă că următorul cuvânt este o cheie, iar spațiile și tabulatorii separă parametrii pe linia de comandă.. De ce shell-ul de comandă are nevoie de caractere speciale va fi discutat în Lectura 8.

Codificări și nume rusești

După cum puteți vedea, până acum în toate numele de fișiere și directoare întâlnite, au fost folosite doar caractere latine și unele semne de punctuație. Acest lucru nu este întâmplător și este cauzat de dorința de a face ca exemplele furnizate să arate la fel pe orice sistem. În Linux, este permisă utilizarea oricăror caractere din orice limbă în numele fișierelor și directoarelor, dar o astfel de libertate necesită sacrificii pe care Methodius, de exemplu, nu le-a putut face.

Faptul este că pentru o lungă perioadă de timp, fiecare simbol (litera) al fiecărei limbi a fost reprezentat în mod tradițional sub formă unu octet. Acest punct de vedere impune restricții foarte stricte asupra număr de litereîn alfabet: nu pot fi mai mult de 256 dintre ele și minus caractere de control, numere, semne de punctuație și alte lucruri - chiar mai puțin. Alfabetele extinse (de exemplu, hieroglifice japoneze și chineze) au trebuit să fie înlocuite cu reprezentări simplificate ale acestora. În plus, cel mai bine este să lăsați întotdeauna primele 128 de caractere din aceste 256 neschimbate, corespunzătoare standardului ASCII, care include latină, numere, punctuație și cele mai comune caractere găsite pe tastatura unei mașini de scris. Interpretarea celor 128 de caractere rămase depinde de ce codificare este instalată pe sistem. De exemplu, în codificarea rusă KOI8-R, al 228-lea caracter al unui astfel de tabel corespunde literei „D”, iar în codificarea ISO-8859-1 din Europa de Vest același caracter corespunde literei „a” cu două puncte deasupra. it (ca litera noastră „e”).

nume de fișiere, înregistrate pe disc în aceeași codificare, arată ridicol dacă răsfoind catalogul a fost instalat altul. Mai mult, multe codificări umplu interval de caractere cu numere de la 128 la 255 nu in totalitate, deci simbolul corespunzător s-ar putea să nu existe deloc! Înseamnă că introduce un astfel de nume de fișier distorsionat de la tastatură (de exemplu, pentru a-l redenumi) nu va fi posibil direct: va trebui să recurgeți la diverse trucuri descrise în prelegerea 8. În cele din urmă, multe limbi, inclusiv rusă, au istoric mai multe codificări 2 Metodiu însuși a primit de mai multe ori e-mailuri, începând cu cuvintele „bNOPNYA” sau „bMHLYUMHE” - rezultatul reprezentării textului care are codificare CP-1251 în codificare KOI8-R.. Din pacate nu in prezent metoda standard indicați codificarea direct în numele fișierului, deci într-unul Sistemul de fișiere Merită să respectați o singură codificare atunci când numiți fișierele.

Există o codificare universală care include caractere din toate scripturile din lume - UNICODE. Standard UNICODEîn prezent devine din ce în ce mai răspândit și pretinde a fi comun tuturor textelor stocate în în format electronic. Cu toate acestea, nu a atins încă versatilitatea dorită, mai ales în zona numelor de fișiere. unu un personaj din UNICODE poate ocupa Mai mult un octet - și atât dezavantajul principal, deoarece sunt multe utile programe de aplicație, lucrează grozav cu codificări pe un singur octet, trebuie să fie complet sau chiar complet reelaborat pentru a-i învăța cum să gestioneze UNICODE. Poate că motivul pentru prevalența insuficientă a acestei codificări este, de asemenea, că UNICODE este un standard foarte greoi și se poate dovedi a fi ineficient atunci când se lucrează cu Sistemul de fișiere, unde viteza de procesare și fiabilitatea sunt calități foarte esențiale.

Acest lucru nu înseamnă că nu ar trebui să utilizați alte limbi decât engleza atunci când denumiți fișierele. Atâta timp cât știți exact în ce codificare este numele fișierului, nu vor fi probleme. Cu toate acestea, Methodius a decis că există garanții în transferul fișierului numit în rusă către unii o alta sistemul poate fi realizat doar prin transmiterea împreună cu el a unei setări de codare, chiar două: în sistemul dvs. și în cel al destinatarului (nu se știe care dintre ele!). Altul, mult mai mult calea ușoară transfer fișier - utilizați în numele său numai caractere ASCII.

Extensii

Mulți utilizatori sunt familiarizați cu conceptul extensie- partea din numele fișierului după punct, de obicei limitată la câteva caractere și indicând tipul de date conținute în fișier. ÎN Sistemul de fișiere Linux nu are reglementări cu privire la extensii: numele fișierului poate avea orice număr de puncte (inclusiv niciunul), iar după ultimul punct poate fi orice număr de caractere 3 Spre deosebire de vechile sisteme de fișiere organizate conform principiului „8+3” (DOS, ISO9660 etc.), unde nu este permis mai mult de un punct în numele fișierului și extensia nu poate fi mai mare de 3 caractere. Această limitare a determinat apariția multor extensii de fișiere cunoscute astăzi, de exemplu, „txt” pentru un fișier text.. Deși extensiile sunt opționale și nu sunt impuse de tehnologie pe Linux, ele sunt utilizate pe scară largă: o extensie permite unei persoane sau unui program să determine, fără a deschide un fișier, doar după numele acestuia, ce tip de date conține. Cu toate acestea, trebuie luat în considerare faptul că o extensie este doar un set de convenții de denumire pentru diferite tipuri de fișiere. Strict vorbind, este posibil ca datele din fișier să nu corespundă extensiei declarate dintr-un motiv sau altul, așa că nu vă puteți baza în întregime pe extensie.

De asemenea, puteți determina tipul de conținut al fișierului pe baza datelor în sine. Multe formate oferă o indicație la începutul fișierului cum ar trebui interpretate informații suplimentare: ca program, date sursă pentru editor de text, Pagina HTML, fișier de sunet, imagine sau altceva. Disponibil utilizator Linux Există întotdeauna un utilitar de fișiere, care este conceput special pentru a determina tipul de date conținute într-un fișier:

$ fișier -- -filename-with- -filename-with-: text ASCII în engleză $ fișier /home/methody /home/methody: director Exemplul 3.1. Determinarea tipului de date dintr-un fișier

Methodius, după ce a uitat ce era conținut în fișierul „-filename-with-”, pe care l-a creat în exemplul prezentat în prelegerea anterioară, a vrut să se uite la conținutul acestuia folosind comanda cat. Cu toate acestea, a fost oprit de Gurevich, care l-a sfătuit să afle mai întâi ce fel de date sunt conținute în acest dosar. Este posibil ca asta fisier binar program executabil, iar într-un astfel de fișier pot exista secvențe care coincid întâmplător cu secvențe de evadare Terminal. Comportamentul terminalului după aceasta poate deveni imprevizibil și utilizator neexperimentat este puțin probabil să reușească să-i facă față. Methodius a primit un răspuns complet corect de la utilitarul de fișiere: fișierul său conține text în limba engleză în codificare ASCII. fișier poate distinge între multe tipuri de date și aproape sigur va produce informatii corecte. Acest utilitar nu are încredere niciodată în extensia fișierului (dacă este prezentă) și analizează datele în sine. fișierul distinge nu numai date diferite, ci și diferite tipuri de fișiere, în special, va raporta dacă fișierul examinat nu este dosar obișnuitși, de exemplu, directorul .

Arborele directorului

Conceptul de director permite sistematiza toate obiectele situate pe un mediu de stocare (de exemplu, un disc). Cele mai multe sisteme de fișiere moderne folosesc un model de organizare a datelor ierarhice: există un singur director care combină toate datele în Sistemul de fișiere- aceasta este „rădăcina” a tot Sistemul de fișiere, directorul rădăcină . Directorul rădăcină poate conține orice obiect Sistemul de fișiere, și în special, subdirectoare (directoare ale primului nivel de imbricare). Acestea, la rândul lor, pot conține și orice obiecte Sistemul de fișiereși subdirectoare (al doilea nivel de imbricare), etc. Astfel, Toate ce este scris pe disc - fișiere, directoare și fisiere speciale- neapărat „aparține” directorul rădăcină: fie direct (conținut în el) fie la un anumit nivel de cuibărit.

Ierarhia directoarelor imbricate unele în altele poate fi corelată cu ierarhia datelor din sistem: combinate tematic fișiere aferente la catalog, cataloage legate tematic - într-unul singur director general etc. Dacă urmați cu strictețe principiul ierarhic, atunci cu atât mai profund nivel de cuibărire director, mai ales că datele conținute în acesta trebuie să fie combinate printr-o anumită caracteristică. Dacă nu urmați acest principiu, atunci se va dovedi în curând mult mai ușor să puneți toate fișierele într-un singur director și să căutați printre ele pe cel de care aveți nevoie decât să efectuați o astfel de căutare în toate subdirectoarele sistemului. Cu toate acestea, în acest caz, despre orice organizarea fișierelor nu este nevoie să vorbim.

Structura Sistemul de fișiere poate fi vizualizat ca un copac 4 Aici ne referim la un arbore în sens strict matematic: un grafic direcționat fără cicluri cu un singur vârf de rădăcină, în care fiecare vârf conține exact o muchie., a cărui „rădăcină” este directorul rădăcină, iar restul sunt situate la vârfuri

Nume de fișiere.

Fișierele sunt identificate prin nume. Utilizatorii dau fișierelor nume simbolice, ținând cont de restricțiile sistemului de operare atât asupra caracterelor utilizate, cât și asupra lungimii numelui. Până de curând, aceste granițe erau foarte înguste. Deci, în fișierul popular Sistemul FAT lungimea numelor este limitată de binecunoscuta schemă 8.3 (8 caractere - numele în sine, 3 caractere - extensia numelui), iar în UNIX System V numele nu poate conține mai mult de 14 caractere. Cu toate acestea, este mult mai convenabil pentru utilizator să lucreze cu nume lungi, deoarece acestea vă permit să acordați fișierului un nume cu adevărat mnemonic, prin care, chiar și după o perioadă destul de lungă de timp, vă puteți aminti ce conține acest fișier. Prin urmare, sistemele de fișiere moderne tind să accepte nume lungi de fișiere simbolice. De exemplu, Windows NT în noul său fișier sistem NTFS specifică faptul că un nume de fișier poate avea până la 255 de caractere, fără a lua în considerare caracterul nul final.

Când treceți la nume lungi, există o problemă de compatibilitate cu aplicațiile create anterior care utilizează nume scurte. Pentru ca aplicațiile să acceseze fișiere conform convențiilor acceptate anterior, sistemul de fișiere trebuie să fie capabil să furnizeze nume scurte (alias-uri) echivalente fișierelor care au nume lungi. Astfel, una dintre sarcinile importante devine problema generării unor nume scurte adecvate.

Nume lungi sunt susținute nu numai de noi sisteme de fișiere, ci și de noi versiuni ale sistemelor de fișiere binecunoscute. De exemplu, Windows 95 folosește sistemul de fișiere VFAT, care este o versiune modificată semnificativ a FAT. Printre multe alte îmbunătățiri, unul dintre principalele avantaje ale VFAT este suportul pentru nume lungi. Pe lângă problema generării de nume scurte echivalente, la implementarea noii versiuni de FAT, o sarcină importantă a fost problema stocării numelor lungi, cu condiția ca metoda de stocare și structura datelor de pe disc să nu se schimbe fundamental.

De obicei fișiere diferite poate avea aceleași nume simbolice. În acest caz, fișierul este identificat în mod unic printr-un așa-numit nume compus, care este o secvență de nume de directoare simbolice. Unele sisteme nu pot da aceluiași fișier mai multe nume diferite, în timp ce altele nu au o astfel de restricție. În acest din urmă caz, sistemul de operare atribuie un nume unic suplimentar fișierului, astfel încât să se poată stabili o corespondență unu-la-unu între fișier și numele său unic. Numele unic este un identificator numeric și este folosit de programele sistemului de operare. Un exemplu în acest sens nume unic fișierul este numărul inodul pe un sistem UNIX.

Toate sistemele de fișiere moderne acceptă denumirea fișierelor pe mai multe niveluri prin menținerea în memorie externă fișiere suplimentare cu o structură specială – directoare. Fiecare director conține numele directoarelor și/sau fișierelor conținute în acel director. Deci, numele complet al fișierului constă dintr-o listă de nume de directoare plus numele fișierului din directorul care indică direct către acest fișier. Diferența dintre modul în care fișierele sunt denumite pe diferite sisteme de fișiere este locul în care începe lanțul de nume.

Există două opțiuni extreme. Multe sisteme de gestionare a fișierelor necesită ca fiecare arhivă de fișiere (un arbore complet de directoare) să fie localizată în întregime pe un singur pachet de disc (sau disc logic, o secțiune a unui pachet de disc fizic, reprezentat folosind instrumentele sistemului de operare ca disc separat). În acest caz, numele complet al fișierului începe cu numele dispozitivului de disc pe care este instalat discul corespunzător. Această metodă de denumire este utilizată în sistemele de fișiere DEC, iar sistemele de fișiere sunt foarte aproape de aceasta calculatoare personale. Această organizare poate fi numită menținerea sistemelor de fișiere izolate.

O altă opțiune extremă a fost implementată în sistemele de fișiere ale sistemului de operare Multics. Acest sistem merită o mare discuție separată; idei originale, dar ne vom concentra doar pe caracteristicile organizării unei arhive de fișiere. În sistemul de fișiere Miltics, utilizatorii au reprezentat întreaga colecție de directoare și fișiere ca un singur arbore. Numele complet al fișierului începea cu numele directorului rădăcină, iar utilizatorul nu trebuia să-și facă griji cu privire la instalarea în dispozitiv de disc orice discuri specifice. Sistemul însuși, căutând un fișier după numele său, a cerut operatorului să instaleze discurile necesare. Un astfel de sistem de fișiere poate fi numit complet centralizat.

Desigur, în multe privințe, sistemele de fișiere centralizate sunt mai convenabile decât cele izolate: sistemul de gestionare a fișierelor preia mai multă muncă de rutină. Dar astfel de sisteme pun probleme semnificative dacă trebuie să mutați un subarboresc al sistemului de fișiere într-o altă instalație de calcul.

Procese în sistemul de operare UNIX.

Pe lângă direcționarea sistemelor de operare anumit tip platforma hardware există mobil Sistem de operare care este ușor de portat pe diferite tipuri de computere (UNIX). În astfel de sisteme de operare, locațiile dependente de hardware sunt localizate și sunt rescrise atunci când sistemul este transferat. Partea independentă de hardware este implementată într-un limbaj de programare nivel inalt, de regulă, în limbajul C și este recompilat atunci când treceți pe o altă platformă.

În prezent, aproximativ 90% dintre computere folosesc sistemul de operare Windows. O clasă mai largă de sisteme de operare este proiectată pentru utilizare pe servere. Această clasă de sisteme de operare include familia UNIX, evoluțiile companiei Microsoft(MS DOS și Windows), produse de rețea Novell si corporatii IBM.

UNIX- un sistem de operare multi-utilizator, multitasking, care include mijloace destul de puternice de protejare a programelor și fișierelor diferiților utilizatori. Sistemul de operare UNIX este independent de mașină, ceea ce asigură o mobilitate ridicată și o portabilitate ușoară a programelor de aplicație pe computere cu diferite arhitecturi. Caracteristică importantă Sistemul de operare al familiei UNIX este modularitatea și setul extins de programe de service, care fac posibilă crearea unui mediu de operare favorabil pentru programatorii utilizatori (adică sistemul este eficient în special pentru specialiști - programatori de aplicații). Indiferent de versiune, caracteristicile comune ale UNIX sunt modul multiplayer cu mijloace de protejare a datelor împotriva accesului neautorizat; implementare multifunctional prelucrare în modul de partajare a timpului; portabilitatea sistemului prin scrierea părții principale în C.



Dezavantaj sisteme UNIX este o intensitate mare a resurselor, care este cel mai adesea redundantă pentru sistemele mici cu un singur utilizator bazate pe computere personale.

În general, sistemele de operare ale familiei UNIX sunt destinate în primul rând către larg local (corporative) Și rețele globale , unind munca a mii de utilizatori. Răspândire largă a UNIX și a acestuia versiunea LINUX primite pe Internet, unde independența mașinii a sistemului de operare este de cea mai mare importanță.

O soluție de compromis a fost folosită în sistemele de fișiere UNIX OS. Pe nivel de bază Aceste sisteme de fișiere acceptă arhive de fișiere izolate. Una dintre aceste arhive este declarată a fi sistemul de fișiere rădăcină. După ce sistemul pornește, puteți „monta” sistemul de fișiere rădăcină și un număr de sisteme de fișiere izolate într-un singur sistem de fișiere comun. Din punct de vedere tehnic, acest lucru se realizează prin crearea de directoare speciale goale în sistemul de fișiere rădăcină. Apelul special de sistem de montare UNIX vă permite să montați directorul rădăcină al unei arhive de fișiere specificate într-unul dintre aceste directoare goale. Odată ce un sistem de fișiere partajat este montat, denumirea fișierelor se face în același mod ca și cum ar fi fost centralizat de la început. Având în vedere că sistemul de fișiere este de obicei montat în timpul pornirii sistemului, utilizatorii UNIX OS de obicei nu se gândesc la originea originală a sistemului de fișiere partajat.