Translita konvertors 1.2 un 1.2.2

Turpinot iepriekš aizsākto tēmu par komentāru latviskošanu ir radies tehnisks risinājums, kas palīdzēs un varbūt pat atvieglos dzīvi, cilvēkiem ar tehniskiem ierobežojumiem, konvertēt tekstu no translita uz normālu latviešu valodu.

Skriptu uzprogrammēja un laipni piedāvāja publiskai lietošanai Grrr. Par ko viņam nesamērīgi liels paldies. Šoreiz alus no manis. 🙂

Tātad visiem mums tiek piedāvāta unikāla, varētu pat teikt, ka Latvijas interneta vēsturē vēl nebijusi iespēja – ievietot savā mājas lapā translita konvertoru, kas ar vienu pogas spiedienu automātiski nomainīs translitā ievadīto tekstu uz normālu latviešu valodu.

Papildināts

Ņemam un testējam Translita konvertors v1.2 4KiB (veca un gļukaina versija)

Lūk arī pēc nelieliem testiem tapa jauna versija. Ļoti ceru, ka šo brīnumu mēs kopīgiem spēkiem ievazāsim Latvijas lapās kā sērgu (labā nozīmē :)).

Kas jauns, kas labs jaunajā versijā:

v1.2.2 13:25 2003-12-12
– Fixed latin word handling to be case-insensitive
– added ‘miljon’ and some others as an exception,
– fixed exception processing to not to drop the last char of word.
v1.2.1 2003-12-12
– fixed exception handling to correctly
process exceptions which don’t start
at beginning of word.
– fixed wrapper func to alert and die
when non-object passed.
v1.2 2003-12-12 – added documentation, fixed triple wovels.
tested on IE5.5 and Mozilla FB 0.7

Un pati programma Translita konvertors v1.2.2 5KiB

P.S.
Skriptā ir jānomaina:
var debug=true; // change this to true to enable lots of debug alerts
uz
var debug=false; // change this to true to enable lots of debug alerts

64 thoughts on “Translita konvertors 1.2 un 1.2.2

  1. Mulders

    un kāpēc es neesmu autorizēts viewot šo peidžu?
    (vo latviski uzraxtiiju)
    hmm nospiedu bet manu ī nenokonvertēja redziet to tur iekavās

    Atbildēt
  2. Mulders

    nu un tādiem vijeboniem kā es moš varētu arī x burtu par ks paartaisīt? laigan ej un atšķir kad raxta ks un kad x ir teixim X-box marka

    Atbildēt
  3. coolynx

    ThA-B: Tev ir visas iespējas to tagad pilnveidot un izlabot, jo reāli eksistējošs prototips, kas darbojas jau ir. Tā vietā, lai gudri runātu jau būtu paspējis izdomāt algoritmu un atsūtījis izlaboto versiju, vai es ne tā domāju?

    Atbildēt
  4. Grrr

    nosūtīšu coolynxam arī jaunāko versiju, bet dokumentāciju, ko uzcepu atļaušos ievietot arī še komentāros:
    ====
    Nodarbojoties ar šo problēmu, ir skaidrs, ka 100% perfektu translita dekoderi izveidot ir praktiski neiespējami gluži vienkārši tāpēc, ka ikdienā lietotais latviešu valodas translits nav viennozīmīgi tulkojams.
    Piemēram: “saaudzis”, “saarts”. Ja pirmo vēl var iekļaut izņēmumu sarakstā vai koriģēt izmantojot kādu latviešu valods vārdnīcu, tad otrajā tikai no konteksta var secināt, vai ir domāts “sa-arts”, vai “sārts”.
    Taču ikdienas lietošanai varētu pietikt ar šeit klātpielikto aptuveno konvertoru, kas derētu lielākajā daļā gadījumu.
    * Lietošana
    ======
    1. Lapā, kur vēlaties izmantot, iekļaujiet norādi uz .js failu:
    2. Šai pat lapā izveidojiet pogu, kuru nospiežot izpildās f-cija doTranslit(), kurai kā parametrs jānorāda lapas elements, kuru vajag pārbaudīt un izmainīt.
    Piemērs:

    ….
    ievietojam:
    DeTranslēt
    Viss.
    * Piezīmes
    ======
    – Programma notestēta uz Internet Explorer 5.5 un Mozilla Firebird 0.7.
    – Programma cenšas izmantot pēc iespējas “saudzīgāku” un praktiski vairāk izmantoto dekodēšanu, līdz ar to uz translitu netiek pārbaudīti:
    1) korekti noformēti URLi (piem. http://me@some.com/query.cgi?blast=1&it=2 );
    2) vārdi, kuros ir latīņu alfabēta burti qwxy ;
    3) netiek translēti atkārtojošies lielie burti, piem. “LJAA”, “LAA” utt.
    – tiek izmantota papildināma izņēmumu sistēma, kurā var norādīt specifiskas burtu kombinācijas (kā regexp) vārdā, kuras nevajag caurskatīt.
    Sākotnēji jau šai sistēmā ir ievietots izņēmums uz 2-kāršu burtu a un e atkārtojumu vārdu sākumos tādos vārdos kā “saasināts”, “neefektīvs”.
    – Programma pēc noklusējuma translē uz UTF-8 simboliem, kas nez kāpēc pareizi rādās lapās ar encodingu Windows-1257. Taču ir paredzēta iespēja pielikt arī citus kodējumus, vienkārši papildinot globālo mainīgo sarakstu ar kodējuma masīvu, un nomainot globālā mainīgā “default_encoding” vērtību.
    Sīkāk skat .js failu.
    / Grrr, 2003

    Atbildēt
  5. Grrr

    argj, tas de-HTMLizators manim nedaudz sabojāja dzīvi.
    ok, ātrumā še stūriekavas aizvietojam ar kvadrātiekavām:

    1. Lapā, kur vēlaties izmantot, iekļaujiet norādi uz .js failu:
    [script language=”Javascript” src=”translit_lat_converter.js” /]
    2. Šai pat lapā izveidojiet pogu, kuru nospiežot izpildās f-cija doTranslit(), kurai kā parametrs jānorāda lapas elements, kuru vajag pārbaudīt un izmainīt.
    Piemērs:
    [form name=”MyForm”]
    [textarea name=”Message”]…[/textarea]
    ….
    ievietojam:
    [button onclick=”doTranslit(MyForm.Message); return false”]DeTranslēt[/button]

    Atbildēt
  6. Pow

    oi nu atvainojiet, shitas konverteetaajs ir pilniigs shits.
    to ka ieeja nekonverteejas uz iēja tak ir viegli saprast, ne? ja peec kaartas ir 3 patskanji, tad nekonverteet naak praataa pirmais man. vajag njemt veeraa valodas likumus nevis vienkaarshi konverteet bezteemaa.

    Atbildēt
  7. tezt

    translits ierulleE! Man domaAt sHis te bums ar (ne)translitu ir pilniIgi nekam nevajadziIgs. Galvenais ir, lai meEs viens otru saprastu, nevis tas cik garumziImes cilveEks lieto. Ja kaAdam liekas, ka sHaAdi meEs saglaAbsim latviesHu valodu, tas stipri maldaAs. Konvertoorus, protams, var rakstiIt, ja daudz laika, bet tie nekad nebuUs pilniIgi un draud sabojaAt tekstu. Speex ir zekjubixees! Atceries to, jaunais programmeEtaAj!

    Atbildēt
  8. tezt (+)

    Interesanti, ko tas konverteetaajs dariis ar tiem vaardiem, ko savaa tekstaa cilveeks ielicis no citaam valodaam? “Shit happens” nokonvertee uz “Šit happens”, kas vairs nav viens un tas pats. Ko dariis ar vaardiem un uzvaardiem, vietvaardiem, nosaukumiem, utt?

    Atbildēt
  9. Pow

    es gribeetu veerst uzmaniibu uz vaardu ellja. nezinu kaa citi raksta (varbuut kaads raksta eljlja), bet es, vaardiem kam ir 2 vienaadi garie vai miikstinaajuma burti, transliteeju (vai kaa nu to procesu sauc 🙂 tikai otro.
    tezt, nu visi tak zin, ka nav iespeejama viennoziimiiga konvertaacija, runa iet par to cik vipendronu ir. vienkaarshaakaas lietas jau var salikt. pirmaa versija bija triviaala, tagad jau daudz maz njem veeraa valodas likumus kautkaadus.

    Atbildēt
  10. Pow

    /dev/null: man liekas, ka progresiivaak buutu nekonverteet, redzot 3 patskanjus peec kaartas. To gan vajag ieseerchot vaardniicaa, kura pieeja nosedz vairaak vaardus — izsleegshana vai mans ieteikums.

    Atbildēt
  11. Pow

    hh, nez kaapeec nekonvertee paa*? taadu vaardu pilniigi noteikti ir pilns.
    ievieshot shaadus wildchar iznjeemumus vajag iechekot vaardniicaa vai nosegto gadiijumu skaits nav mazaaks par nenosegto gadiijumu skaitu.

    Atbildēt
  12. Vistu Zaglis

    Nja… diemžēl garumzīmes – tas itkā ir labi (nu re, atkal cilvēki vairs nesasprings un mierīgi translitā driķierēs), bet tiem, kas spītīgi raksta “magnetafons”, “batereja”, “grauzts” (no vārda graut) un “erakcija” tik un tā nekas nepalīdzēs.
    Laacza brutālā pieeja man šķita pareizāka.
    Bet apsveicami tik un tā, ledus ir sakustējies! 🙂

    Atbildēt
  13. ndqc

    ar to konvertoru tagad tiešām būs jautrāk. jāievieš pareizraxtiiba arī translitam. jo savādāk konvertors nepalīdzēs 🙂

    Atbildēt
  14. koko

    Nu labi, ka kaut kas taisa taadus skriptinjus, tachu kaut kur es jau to biju redzeejis :))) NU un tas bija jau kaadus meeneshus triis atpakalj, kad es to pamaniiju, redz vienaa forumaa dzeks gribeeja dabuut progzu, kas paarveersh translitu uz normaalu, jo taa redz aatraak rakstiit… tad nu progza taada neatradaas, bet toreiz laacz bija iemetis linku uz vinja skriptinju , kas paartaisa no translita normaalaa un otraadi… Mans jau bija saacis domaat, ka esmu nokjeeris gljuku, tachu ieskatiijos laacz blogaa un ieraudziiju, ka vinjsh raksta tieshi manas domas… Nu nesaku, ka kaut kas te ticis zagts vai kas liidziigs, bet nu iesaku atvainoties laaczam un labaakajaa gadiijumaa mesties kopaa un skriptu izkopt kaartiigi :))
    –=Noveerotaajs no malas=–

    Atbildēt
  15. Grrr

    Es zinu, ka laacz ir uztaisījis savu translita konvertoru, un arī skatījos viņējo, taču manējais ir uzcepts pilnīgi no 0 un atļaušos apgalvot – realizēts pavisam savādāk. Domāju laacz var to apstiprināt. 🙂

    Atbildēt
  16. ui

    manuprat labak tomer pieradinaties rakstit ar garumzimem un (kur vajag) lietot pretejo konvertoru – uz translitu. tad pieradums netrauces rakstit oficialus dokumentus. pietam, apgrieztais konvertors darbojas bez gljukiem…

    Atbildēt
  17. micro

    izstrādājums laps, bet vienīgais kas man nepatika bija tas ka kad nospiež pārveidot viņš tur tos enotos lodziņus atvēra. un ko darīt tiem kas no js neko nerubī piem kā es??

    Atbildēt
  18. Mulders

    taa nu shkjiet, ka es esmu veixmiigs luuzers visaa shanaa barinjaa!
    Man ar Firebirdu straadaa a bet ar IE 5.0 nesanaaca 🙁
    Tobish shamais kaut ko bljaustaas par to ka gaida aizveroshaas ] 74 rindinjaa (nezinu vai sanaak preciizi)
    bet shkjiet, ka tas ir taa vieta kur shitais kods
    var translit=[
    /^Paaa/,/^Neee/,/^paaa/,/^neee/,
    /Aa/g, /Ch/g, /Ee/g, /Gj/g, /Ii/g, /Kj/g, /Lj/g, /Nj/g, /Sh/g, /Uu/g, /Zh/g,
    /aa/g, /ch/g, /ee/g, /gj/g, /ii/g, /kj/g, /lj/g, /nj/g, /sh/g, /uu/g, /zh/g ];
    Ja godiigi arii es jamo nesaprotu!

    Atbildēt
  19. Mulders

    sorry par spamu, bet shajaa lpp ir cita gljuka… kad spiezhu to podzinju, saka ka objekts nesuportee metodi vai propertiju 210 rindinjaa 🙁
    vsjo eju guleet 🙁

    Atbildēt
  20. PoRToSS

    Hm, kaadeelj izmainjas shajaa tuuliit ir rakstiitas anglju meelee?
    Un otrs, jautaajums, uz kuru gribeetu sagaidiit atbildi, vai coolynx taisaas latviskot savu niku.

    Atbildēt
  21. ui

    Mulder, kaa jau teicu, deretu izlabot sarunas.lv vizualos gljukus. ar firebirdu dazhos forumos viss saturs aizbrauc pa labi (aarpus ekraana) un ir jaaskrollee…

    Atbildēt
  22. InDOOM

    hmm, a kāpēc versiju vēsture ir angļu valodā? Neliekas, ka šis skripts ir domāts priekš ārzemniekiem :/ Kakta abidna vnk.

    Atbildēt
  23. Jānis

    0. Programma netaisa kļūdas un atpazīst izņēmumus burtu izmaiņas algoritmā. Ar aršanu man liekas, vienīgais, kas izraisa kernel panis. “Paaris” “paaršu”. “saarts” ir tikpat kā vienīgie vārdi, ko mani izņēmumi neatrod. Jeb? Skat JAUNUMU http://abens.net/latvisko/index_lv.html
    1. Jau esošu “translita” tekstu (t.s. “vācu” ortogrāfijā) var kopēt ub ielīmēt Teksta Latviskotajs (TL) logā un atgūt pareizu tekstu ar latviešu burtiem. Vardu sakot var izlabot veselus čatus vienā vērienā ja grib.
    2. Var rakstīt TL: logā un reize skatīties kā top skaisti burti blakus (HTML- webbrowser.objekta logā). Var kopēt un līmēt notepad, epastā u.t.t.,
    3. Var kopēt HTML-draudzīgo Unicode tekstu no Unicode loga ja vajag līmēt draņķīgā HTML editora velnā, kurš neņem pretī tos Latin extended-A burtus. Atkal viss OK
    Var lietot “j’usu” translita variantu ja grib!!

    Atbildēt
  24. ui

    2 Mulders: nea nu agraak pavisam drankjiigi bija, bet tad nesen vairums lapu salabojaas, tb. ieliida lapaa. tagad ir taa, ka pamatlapas (forumu un teemu saraksti) horizontaali savietojas, bet ieejot konkreetaa teemaa, paradas hor. skrollbaars.
    tas paradas, ja ar text-size (ctrl++) palielina burtu izmeru. ar m$IE ir ok. man izstaas, ka vainigs formas lauks Tēma (name=”topic” size=”100%”)

    Atbildēt
  25. Velko

    Hmm… šēma, vakūms redzies sanāca…
    Aršana domājams nav tik briesmīga problēma, diez vai diskusijas par lauksaimniecības problēmām varētu būt dikti populāras, turklāt “saarts” var uzrakstīt arī kā “uzarts”, kas vairs nekādas problēmas nerada, turklāt pareizāk…
    Labi, ka coolynx nepārtaisa par “Cōlinks” 🙂

    Atbildēt
  26. Anonīmais

    hmm…nu shitaa ideja ir veca kaa siena skjuunja MUURIS.. un realizeeta dziivee veel beernudaarzaa.. man piemeeram bija kauns to publiceet netaa, kameer neesmu sataisiijis vismaz dalju iznjeemumu un specgadiijumu..
    vot ja kaads uztaisiis ar to, tad REEEESPECT!
    ata… nu naf tas otrs batons tur apakshaa?? buutu vismaz vietaam samainiijs clx! a to tur kur ira parasti “piev cmt” tagad “conv from transl”.. :/

    Atbildēt

Ieraksti komentāru

Tava e-pasta adrese netiks publicēta. Obligātie lauki ir atzīmēti kā *