Darbas su tekstu. Kaip nustatyti failo kodavimą

Kompiuteriai

Leiskite sužinoti, kokia yra failo kodavimo funkcija. Paprastai kodavimas yra baitų simbolių rinkinys, kuris atitinka tam tikros kalbos abėcėlę. Kiekvienai kalbai yra konkreti tokių kodavimo ženklų seka. Kartais reikia nustatyti kodavimą. Apsvarstykite tai teksto dokumento pavyzdžiu.

Ko jums reikia

Tam tikrų programinės įrangos rinkinys. Pirmiausia reikia pakankamai tokio tipo programų Žodis, "KWrite", "Firefox" naršyklė ir atpažinimo įrankiai. enca.

Galite nustatyti failo kodavimą naudodami universalų "Microsoft Word" redaktorių. Prieš tai ji turi būti įdiegta iš paketo Biuras. Kai programa yra įdiegta ir ją galima atidaryti naudojant piktogramą W formos piktogramos formoje, eikite į kitą žingsnį.

Kitas pripažinimo etapas

Programos naršymo juostoje atidarykite elementus "Failas" - "Atidaryti" vienu metu. Tas pats gali būti padaryta naudojant klaviatūros kombinaciją Ctrl + O.

Tada dialogo lange pasirinkite norimą katalogą ir iš tikrųjų skaitomą failą. Pasirinkite jį pele, spustelėkite mygtuką "atidaryti".

Kai failas neturi atitikmenų rinkinio CP1251, programa bando nustatytikodavimas. Galimų rungtynių sąrašas bus rodomas. Siūlomuose simbolių rinkiniuose dešinėje sąrašo dalyje pasirinkite vieną iš koduotės. Jei pasirinktas teisingas pasirinkimas, atpažintas tekstas bus rodomas mėginio elementu.

Kaip nustatyti kodavimą naudojant KWrite

Be teksto apdorojimo preprocesoriaus "Word" yra ir kitų funkcinių priemonių. Vienas iš jų yra Kwrite (analogas unix sistemoms). Kad nebūtų painiojami, pasirašysiu užduotį "apibrėžti kodavimo dokumentą KWrite".

  1. Įkelkite į programos failą su plėtiniu .txt.
  2. Įrašykite koduotes, kol vienas iš jų netinka.
  3. Norėdami atlikti 2 žingsnį, eikite į įrankių parinktį encoding meniu.

Mozilla Firefox naršyklė, tas pats tikslas - nustatyti kodavimą

Šis principas yra toks pat kaip ir teksto paslaugų srityje. Paleiskite įdiegtą naršyklę, kad ji būtų vykdoma, o jei ji neįdiegta, atsisiųskite diegimo programą iš "mozilla.org".

Tada atidarymo programos lange turėsite atidarytitekstinį dokumentą per meniu "Failas", submeniu "Atidaryti failą". Jei pasirinktas failas rodomas be iškraipymų ir tekstas yra įskaitomas, koduotę lengva nustatyti.

Norėdami tai padaryti, eikite į "View" - "encoding", yra rodomi keli simbolių rinkiniai, o šalia pažymėtas yra naršyklės apibrėžta kodavimo funkcija.

Jei tekstas neteisingai atpažįstamas, pasirinkite "Išplėstinė" poskyrį, eksperimentuokite jį su kodais arba pasirinkite vertę "automatinis".

Specializuota programinė įranga - mes dirbame su enca

Taip pat yra keletas pagalbinių elektroninių priemonių, leidžiančių nustatyti neformuoto teksto kodavimą.

Tiems, kurie yra įpratę dirbti pagal UNIX, tinkanaudingumo enca Jis gali būti įdiegtas naudojant paketų tvarkytuvės paslaugą. Radau esamą paketų kategoriją, galite tęsti programinės įrangos diegimą.

Norėdami susipažinti su atpažinimo kalbomis, išleiskite komandų enca-list kalbas, naudodami terminalą.

Jei reikia nustatyti teksto failo kodą po klavišo (g), įveskite jo pavadinimą ir po parinkties (L) įveskite atpažinimo kalbą maždaug taip pat:

enca -l rusų -g /home/vic/temp/myfile.txt.

Apibendrinant tai, kas pasakyta apie kodavimą

Manau, kad pirmiau minėti paslaugų teikėjai vartotojui turės pakankamai įrankių, skirtų tekstų dekodavimui.

Dabar, iš tikrųjų, tai viskas apie atpažįstamąkodavimas. Standartiniais tikslais manau, kad ši programinė įranga yra gerai. Yra daugiau specializuotų metodų nustatyti, tačiau jų svarstymas nepatenka į šio straipsnio taikymo sritį.

"Microsoft Word" pripažinimo šaltinis gali būti paprastas tekstas arba sudėtingo formato dokumentas.

Komentarai (0)
Pridėti komentarą