Turpinot iepriekš aizsākto tēmu par komentāru latviskošanu ir radies tehnisks risinājums, kas palīdzēs un varbūt pat atvieglos dzīvi, cilvēkiem ar tehniskiem ierobežojumiem, konvertēt tekstu no translita uz normālu latviešu valodu.
Skriptu uzprogrammēja un laipni piedāvāja publiskai lietošanai Grrr. Par ko viņam nesamērīgi liels paldies. Šoreiz alus no manis. 🙂
Tātad visiem mums tiek piedāvāta unikāla, varētu pat teikt, ka Latvijas interneta vēsturē vēl nebijusi iespēja – ievietot savā mājas lapā translita konvertoru, kas ar vienu pogas spiedienu automātiski nomainīs translitā ievadīto tekstu uz normālu latviešu valodu.
Papildināts
Ņemam un testējam Translita konvertors v1.2 4KiB (veca un gļukaina versija)
Lūk arī pēc nelieliem testiem tapa jauna versija. Ļoti ceru, ka šo brīnumu mēs kopīgiem spēkiem ievazāsim Latvijas lapās kā sērgu (labā nozīmē :)).
Kas jauns, kas labs jaunajā versijā:
v1.2.2 13:25 2003-12-12
– Fixed latin word handling to be case-insensitive
– added ‘miljon’ and some others as an exception,
– fixed exception processing to not to drop the last char of word.
v1.2.1 2003-12-12
– fixed exception handling to correctly
process exceptions which don’t start
at beginning of word.
– fixed wrapper func to alert and die
when non-object passed.
v1.2 2003-12-12 – added documentation, fixed triple wovels.
tested on IE5.5 and Mozilla FB 0.7
Un pati programma Translita konvertors v1.2.2 5KiB
P.S.
Skriptā ir jānomaina:
var debug=true; // change this to true to enable lots of debug alerts
uz
var debug=false; // change this to true to enable lots of debug alerts
un kāpēc es neesmu autorizēts viewot šo peidžu?
(vo latviski uzraxtiiju)
hmm nospiedu bet manu ī nenokonvertēja redziet to tur iekavās
nu un tādiem vijeboniem kā es moš varētu arī x burtu par ks paartaisīt? laigan ej un atšķir kad raxta ks un kad x ir teixim X-box marka
a demo kur???
lupus: Demo ir implementēts jau šajā lapā
“Miljonā pieeja” -> “Miļonā piēja”
kur ir iznjeemumi uz priedēkļiem?
ThA-B: Tev ir visas iespējas to tagad pilnveidot un izlabot, jo reāli eksistējošs prototips, kas darbojas jau ir. Tā vietā, lai gudri runātu jau būtu paspējis izdomāt algoritmu un atsūtījis izlaboto versiju, vai es ne tā domāju?
a shitajaa lapaa arii taa buus?
a šitajā lapā arī tā būs?
nosūtīšu coolynxam arī jaunāko versiju, bet dokumentāciju, ko uzcepu atļaušos ievietot arī še komentāros:
====
Nodarbojoties ar šo problēmu, ir skaidrs, ka 100% perfektu translita dekoderi izveidot ir praktiski neiespējami gluži vienkārši tāpēc, ka ikdienā lietotais latviešu valodas translits nav viennozīmīgi tulkojams.
Piemēram: “saaudzis”, “saarts”. Ja pirmo vēl var iekļaut izņēmumu sarakstā vai koriģēt izmantojot kādu latviešu valods vārdnīcu, tad otrajā tikai no konteksta var secināt, vai ir domāts “sa-arts”, vai “sārts”.
Taču ikdienas lietošanai varētu pietikt ar šeit klātpielikto aptuveno konvertoru, kas derētu lielākajā daļā gadījumu.
* Lietošana
======
1. Lapā, kur vēlaties izmantot, iekļaujiet norādi uz .js failu:
2. Šai pat lapā izveidojiet pogu, kuru nospiežot izpildās f-cija doTranslit(), kurai kā parametrs jānorāda lapas elements, kuru vajag pārbaudīt un izmainīt.
Piemērs:
…
….
ievietojam:
DeTranslēt
Viss.
* Piezīmes
======
– Programma notestēta uz Internet Explorer 5.5 un Mozilla Firebird 0.7.
– Programma cenšas izmantot pēc iespējas “saudzīgāku” un praktiski vairāk izmantoto dekodēšanu, līdz ar to uz translitu netiek pārbaudīti:
1) korekti noformēti URLi (piem. http://me@some.com/query.cgi?blast=1&it=2 );
2) vārdi, kuros ir latīņu alfabēta burti qwxy ;
3) netiek translēti atkārtojošies lielie burti, piem. “LJAA”, “LAA” utt.
– tiek izmantota papildināma izņēmumu sistēma, kurā var norādīt specifiskas burtu kombinācijas (kā regexp) vārdā, kuras nevajag caurskatīt.
Sākotnēji jau šai sistēmā ir ievietots izņēmums uz 2-kāršu burtu a un e atkārtojumu vārdu sākumos tādos vārdos kā “saasināts”, “neefektīvs”.
– Programma pēc noklusējuma translē uz UTF-8 simboliem, kas nez kāpēc pareizi rādās lapās ar encodingu Windows-1257. Taču ir paredzēta iespēja pielikt arī citus kodējumus, vienkārši papildinot globālo mainīgo sarakstu ar kodējuma masīvu, un nomainot globālā mainīgā “default_encoding” vērtību.
Sīkāk skat .js failu.
/ Grrr, 2003
argj, tas de-HTMLizators manim nedaudz sabojāja dzīvi.
ok, ātrumā še stūriekavas aizvietojam ar kvadrātiekavām:
…
1. Lapā, kur vēlaties izmantot, iekļaujiet norādi uz .js failu:
[script language=”Javascript” src=”translit_lat_converter.js” /]
2. Šai pat lapā izveidojiet pogu, kuru nospiežot izpildās f-cija doTranslit(), kurai kā parametrs jānorāda lapas elements, kuru vajag pārbaudīt un izmainīt.
Piemērs:
[form name=”MyForm”]
[textarea name=”Message”]…[/textarea]
….
ievietojam:
[button onclick=”doTranslit(MyForm.Message); return false”]DeTranslēt[/button]
…
anyway – thanks, veci!
šķiet ka reāli noderēs
oi nu atvainojiet, shitas konverteetaajs ir pilniigs shits.
to ka ieeja nekonverteejas uz iēja tak ir viegli saprast, ne? ja peec kaartas ir 3 patskanji, tad nekonverteet naak praataa pirmais man. vajag njemt veeraa valodas likumus nevis vienkaarshi konverteet bezteemaa.
soor neizlasiiju komentus.. jauna versija laikam to adresee
translits ierulleE! Man domaAt sHis te bums ar (ne)translitu ir pilniIgi nekam nevajadziIgs. Galvenais ir, lai meEs viens otru saprastu, nevis tas cik garumziImes cilveEks lieto. Ja kaAdam liekas, ka sHaAdi meEs saglaAbsim latviesHu valodu, tas stipri maldaAs. Konvertoorus, protams, var rakstiIt, ja daudz laika, bet tie nekad nebuUs pilniIgi un draud sabojaAt tekstu. Speex ir zekjubixees! Atceries to, jaunais programmeEtaAj!
Interesanti, ko tas konverteetaajs dariis ar tiem vaardiem, ko savaa tekstaa cilveeks ielicis no citaam valodaam? “Shit happens” nokonvertee uz “Šit happens”, kas vairs nav viens un tas pats. Ko dariis ar vaardiem un uzvaardiem, vietvaardiem, nosaukumiem, utt?
Grrr: pieliec vēl pie izņēmumiem: “ieekonomeet”=”ieekonomēt”, “saaardiit”=”saārdīt”
es gribeetu veerst uzmaniibu uz vaardu ellja. nezinu kaa citi raksta (varbuut kaads raksta eljlja), bet es, vaardiem kam ir 2 vienaadi garie vai miikstinaajuma burti, transliteeju (vai kaa nu to procesu sauc 🙂 tikai otro.
tezt, nu visi tak zin, ka nav iespeejama viennoziimiiga konvertaacija, runa iet par to cik vipendronu ir. vienkaarshaakaas lietas jau var salikt. pirmaa versija bija triviaala, tagad jau daudz maz njem veeraa valodas likumus kautkaadus.
/dev/null: man liekas, ka progresiivaak buutu nekonverteet, redzot 3 patskanjus peec kaartas. To gan vajag ieseerchot vaardniicaa, kura pieeja nosedz vairaak vaardus — izsleegshana vai mans ieteikums.
“paalis”=”pālis”, “paaksts”=”pāksts”
nja, droši vien vēl papilnam visādu vārdu…
hh, nez kaapeec nekonvertee paa*? taadu vaardu pilniigi noteikti ir pilns.
ievieshot shaadus wildchar iznjeemumus vajag iechekot vaardniicaa vai nosegto gadiijumu skaits nav mazaaks par nenosegto gadiijumu skaitu.
un ja grib rakstiit taapataas
Vakūms kam smadzenēs sēž
Tas vai ik dienas tualetes mēž 😉
es tikai te testēju kā šitas verķis strādā, podiņš kļūs par īsti latvisku lapiņu
jasna! 🙂
Pow: paa* nepareizi konvertējas dēļ priedēkļa “pa”.
/dev/null, njaa, skaidrs. nu tad vajag skatiities kaadu vaardu ir vairaak — paa* vai pā*.
nuu kas par lietuu
nū kas par lietū
vēl arī “ie” un “pie”
ieēsties, pieēsties
iēesties, piēesties
Nja… diemžēl garumzīmes – tas itkā ir labi (nu re, atkal cilvēki vairs nesasprings un mierīgi translitā driķierēs), bet tiem, kas spītīgi raksta “magnetafons”, “batereja”, “grauzts” (no vārda graut) un “erakcija” tik un tā nekas nepalīdzēs.
Laacza brutālā pieeja man šķita pareizāka.
Bet apsveicami tik un tā, ledus ir sakustējies! 🙂
Nevis “paaksts”=”pāksts”, bet vienkārši – “āksts”.
ar to konvertoru tagad tiešām būs jautrāk. jāievieš pareizraxtiiba arī translitam. jo savādāk konvertors nepalīdzēs 🙂
Nu labi, ka kaut kas taisa taadus skriptinjus, tachu kaut kur es jau to biju redzeejis :))) NU un tas bija jau kaadus meeneshus triis atpakalj, kad es to pamaniiju, redz vienaa forumaa dzeks gribeeja dabuut progzu, kas paarveersh translitu uz normaalu, jo taa redz aatraak rakstiit… tad nu progza taada neatradaas, bet toreiz laacz bija iemetis linku uz vinja skriptinju , kas paartaisa no translita normaalaa un otraadi… Mans jau bija saacis domaat, ka esmu nokjeeris gljuku, tachu ieskatiijos laacz blogaa un ieraudziiju, ka vinjsh raksta tieshi manas domas… Nu nesaku, ka kaut kas te ticis zagts vai kas liidziigs, bet nu iesaku atvainoties laaczam un labaakajaa gadiijumaa mesties kopaa un skriptu izkopt kaartiigi :))
–=Noveerotaajs no malas=–
Es zinu, ka laacz ir uztaisījis savu translita konvertoru, un arī skatījos viņējo, taču manējais ir uzcepts pilnīgi no 0 un atļaušos apgalvot – realizēts pavisam savādāk. Domāju laacz var to apstiprināt. 🙂
Nu normāli jau bet jāspiež tā poga, varētu uzlikt auto.
auto nevajag, jo cilvēks varbūt tieši raksta pareizi, un viņam ir teksts, ko NEVAJAG detranslitēt.
a nevajag arī iekļaut “x” kā “ks”, daži tomēr raxta arī “ks” kā “x” ?
tas jau būtu atkarīgs no konkrētā gadījuma.
man šķita drošāk vispār neaztikt vārdus, kuri satur qwxy .
Man konvertors patīk! Paldies Grrr un paarējiem, kas palīdz to veidot un ieviest dzīvē. Malači!
2 suspends: KS-Box un KS-Faili bikiņ būtu par traku 🙂
šitais būs jāieliek arī iekš mana webloga…. jo atbalstu šito lietu
aaswssaa āāāāāā
manuprat labak tomer pieradinaties rakstit ar garumzimem un (kur vajag) lietot pretejo konvertoru – uz translitu. tad pieradums netrauces rakstit oficialus dokumentus. pietam, apgrieztais konvertors darbojas bez gljukiem…
izstrādājums laps, bet vienīgais kas man nepatika bija tas ka kad nospiež pārveidot viņš tur tos enotos lodziņus atvēra. un ko darīt tiem kas no js neko nerubī piem kā es??
taa nu shkjiet, ka es esmu veixmiigs luuzers visaa shanaa barinjaa!
Man ar Firebirdu straadaa a bet ar IE 5.0 nesanaaca 🙁
Tobish shamais kaut ko bljaustaas par to ka gaida aizveroshaas ] 74 rindinjaa (nezinu vai sanaak preciizi)
bet shkjiet, ka tas ir taa vieta kur shitais kods
var translit=[
/^Paaa/,/^Neee/,/^paaa/,/^neee/,
/Aa/g, /Ch/g, /Ee/g, /Gj/g, /Ii/g, /Kj/g, /Lj/g, /Nj/g, /Sh/g, /Uu/g, /Zh/g,
/aa/g, /ch/g, /ee/g, /gj/g, /ii/g, /kj/g, /lj/g, /nj/g, /sh/g, /uu/g, /zh/g ];
Ja godiigi arii es jamo nesaprotu!
taax stop… a bet uz shitaas paages gljuku nav 🙁
shoto man rokas liikas 🙁
sorry par spamu, bet shajaa lpp ir cita gljuka… kad spiezhu to podzinju, saka ka objekts nesuportee metodi vai propertiju 210 rindinjaa 🙁
vsjo eju guleet 🙁
Hm, kaadeelj izmainjas shajaa tuuliit ir rakstiitas anglju meelee?
Un otrs, jautaajums, uz kuru gribeetu sagaidiit atbildi, vai coolynx taisaas latviskot savu niku.
Mulder, kaa jau teicu, deretu izlabot sarunas.lv vizualos gljukus. ar firebirdu dazhos forumos viss saturs aizbrauc pa labi (aarpus ekraana) un ir jaaskrollee…
nu sit nost, tagad ar firebirdu workoju, viss ir čikeniekā… nekādi nekas slikts nenotiek 🙁
hmm, a kāpēc versiju vēsture ir angļu valodā? Neliekas, ka šis skripts ir domāts priekš ārzemniekiem :/ Kakta abidna vnk.
0. Programma netaisa kļūdas un atpazīst izņēmumus burtu izmaiņas algoritmā. Ar aršanu man liekas, vienīgais, kas izraisa kernel panis. “Paaris” “paaršu”. “saarts” ir tikpat kā vienīgie vārdi, ko mani izņēmumi neatrod. Jeb? Skat JAUNUMU http://abens.net/latvisko/index_lv.html
1. Jau esošu “translita” tekstu (t.s. “vācu” ortogrāfijā) var kopēt ub ielīmēt Teksta Latviskotajs (TL) logā un atgūt pareizu tekstu ar latviešu burtiem. Vardu sakot var izlabot veselus čatus vienā vērienā ja grib.
2. Var rakstīt TL: logā un reize skatīties kā top skaisti burti blakus (HTML- webbrowser.objekta logā). Var kopēt un līmēt notepad, epastā u.t.t.,
3. Var kopēt HTML-draudzīgo Unicode tekstu no Unicode loga ja vajag līmēt draņķīgā HTML editora velnā, kurš neņem pretī tos Latin extended-A burtus. Atkal viss OK
Var lietot “j’usu” translita variantu ja grib!!
2 Mulders: nea nu agraak pavisam drankjiigi bija, bet tad nesen vairums lapu salabojaas, tb. ieliida lapaa. tagad ir taa, ka pamatlapas (forumu un teemu saraksti) horizontaali savietojas, bet ieejot konkreetaa teemaa, paradas hor. skrollbaars.
tas paradas, ja ar text-size (ctrl++) palielina burtu izmeru. ar m$IE ir ok. man izstaas, ka vainigs formas lauks Tēma (name=”topic” size=”100%”)
uzmet meilu, a to te spams saakās!
Hmm… šēma, vakūms redzies sanāca…
Aršana domājams nav tik briesmīga problēma, diez vai diskusijas par lauksaimniecības problēmām varētu būt dikti populāras, turklāt “saarts” var uzrakstīt arī kā “uzarts”, kas vairs nekādas problēmas nerada, turklāt pareizāk…
Labi, ka coolynx nepārtaisa par “Cōlinks” 🙂
Grrr = rom? 🙂
just curious
hmm…nu shitaa ideja ir veca kaa siena skjuunja MUURIS.. un realizeeta dziivee veel beernudaarzaa.. man piemeeram bija kauns to publiceet netaa, kameer neesmu sataisiijis vismaz dalju iznjeemumu un specgadiijumu..
vot ja kaads uztaisiis ar to, tad REEEESPECT!
ata… nu naf tas otrs batons tur apakshaa?? buutu vismaz vietaam samainiijs clx! a to tur kur ira parasti “piev cmt” tagad “conv from transl”.. :/
Umir moj kakjis !
(Umir moj kakjis !)
[Umir moj kakjis !]
{Umir moj kakjis !}
4ota kj nenjem kaa ķ !!
ņā šitai progai ir daži trūkumiņi… ;P ghe ghe
asdf asdfasdfasdfsadf
testiņš kāpēc šitais netranslē
aaarpraac aaksts chura
nu un. vai nav vienalga.