Lietuviško teksto perkodavimas
Kas tai?
Senais tamsiais laikais buvo vartojama daug skirtingų kodavimo lentelių lietuviškiems tekstams saugoti. LTT (Lithuanian Text Tool) yra programėlė, atliekanti dvi funkcijas:
- ji bando nustatyti, kokia lentele yra užkoduotas tekstas
$ ltt index.in
index.in
Probability Charset Seen characters
57% *! Latin-7/ISO-8859-13/Baltic-RIM/ANSI-1257 .........ąč.ėįšųūž
38% 771/773/KBL ..š...ų.........ū.
4% Latin-4/ISO-8859-4/Latin-6/ISO-8859-10 ..........č.....ž.
* -- file contains Lithuanian letters unique to this charset
! -- file contains no Lithuanian letters outside of this charset
- ji gali perkoduoti lietuviškas raides iš vienos lentelės į kitą
$ ltt -c latin-7 latin-4 index.in
Latin-7/ISO-8859-13/Baltic-RIM/ANSI-1257 -> Latin-4/ISO-8859-4/Latin-6/ISO-8859-10:
index.in
$ ltt index.in
index.in
Probability Charset Seen characters
66% *! Latin-4/ISO-8859-4/Latin-6/ISO-8859-10 .........±č.ģē¹łž¾
16% 771/773/KBL ...............ł..
11% Latin-7/ISO-8859-13/Baltic-RIM/ANSI-1257 ..........č......ž
5% 772/774/775 .....¾............
* -- file contains Lithuanian letters unique to this charset
! -- file contains no Lithuanian letters outside of this charset
Įvairios pastabos:
- Perkoduojant keičiamos tik lietuviškos raidės
- Palaikomos šios kodų lentelės:
- 772, 774, 775
- 770 (dar vadinama IBM Baltic)
- 771 (dar vadinama KBL), 773
- ISO-8859-13 (dar vadinama Latin-7), Windows-1257 (dar vadinama Baltic RIM)
- ISO-8859-4 (dar vadinama Latin-4), ISO-8859-10 (dar vadinama Latin-6)
- Taip pat yra galimybė perkoduoti į „šveplą“ tekstą (deja, perkoduoti atgal nebepavyks...)
- Programa su vartotoju bendrauja angliškai (aš keistas žmogus)
- Programėlė parašyta Paskaliu. Ją galima sukompiliuoti DOS, Windows bei Linux terpėse naudojant Turbo Pascal, Borland Delphi arba Free Pascal.
- Programa yra laisva ir nemokama, jos licencija -- GNU GPL.
Instrukcija
$ ltt Lithuanian Text Tool version 0.9.0 Copyright (c) 1999-2001 Marius Gedminas <mgedmin@b4net.lt> This is Free Software. See the GNU General Public Licence for details. Try to autodetect charset: ltt [-q] <filename> -q quick mode: only check first kilobyte Convert between charsets: ltt -c <charset1> <charset2> [-b <ext>] <filename> ... -b <ext> create backup files with extension <ext> (<ext> should begin with a dot, e.g. -b .bak) Use `-' instead of <filename> for standard input Possible charset values: 772 774 775 770 771 773 kbl lat7 latin-7 iso-8859-13 brim baltic-rim 1257 lat4 latin-4 iso-8859-4 lat6 latin-6 iso-8859-10 You can also use `ascii' for <charset2> Note: only 18 Lithuanian national letters are affected.
Parsisiuntimas
LTT versija 0.9.0
- ltt.pas (16K) -- pradinis kodas
- COPYING (18K) -- licencija (GNU GPL v2)
- ltt-0.9.0.zip (51K) -- ZIP archyvas su pradiniu kodu bei sukompiliuotomis Windows ir DOS versijomis.
- ltt-0.9.0.tar.gz (46K) -- TAR.GZ archyvas su pradiniu kodu bei sukompiliuota Linux versija.
Linux
- ltt (79K) -- statinė ELF programa i386 architektūrai
Windows
- ltt32.exe (51K) -- Win32 programa
DOS
- ltt16.exe (13K) -- DOS programa