Com traduir l'aplicació de recollida de signatures. L'aplicació de recollida de signatures és un programa d'ordinador que presenta les pàgines web necessàries a l'usuari, en recull les dades que entra al formulari per signar, comprova possibles errors, envia els correus informant dels errors o agraint la signatura, desa les dades de les adhesions a la base de dades i mostra les dades públiques de les adhesions. L'original està fet en català, però l'aplicació preveu tenir diverses còpies dels continguts en diferents llengües, per a que es pugui traduir. Per a que pugui funcionar en una nova llengua cal traduir els fitxers que contenen els textos. Aquests fitxers són llegits i combinats pels programes segons les necessitats, i hi ha elements comuns a totes les llengües (com ara imatges i fulls d'estil). Per això és important respectar-ne l'estructura. Per traduir l'aplicació no és suficient anar a la web, copiar els textos que veiem i enviar un fitxer ofimàtic o un fitxer html amb els textos traduïts. El programa no sabria què fer-ne, necessita trobar els textos dintre de les marques necessàries per saber on van i com s'utilitzen en cada cas. Si un traductor es limités a enviar els textos traduïts en un fitxer nou algú altre hauria d'anar copiant la traducció frase per frase o paraula per paraula al lloc corresponent del fitxer corresponent. Aquesta feina d'integració de la traducció és tanta o més feina que fer la traducció, i no podem garantir que ningú tingui temps de fer-la. A més, si qui fa la integració no coneix la llengua a la que s'han traduït els textos és fàcil que s'equivoqui i posi textos on no toca, de manera que després l'aplicació digui el que no ha de dir. Per tant per minimitzar la feina global i els errors el que cal és que el traductor o traductora ja faci la traducció sobre els fitxers originals, perquè després només calgui copiar el resultat al nou directori de la nova llengua i funcioni automàticament. Per això escric aquestes instruccions sobre com traduir l'aplicació de recollida de signatures. Les traduccions que no segueixin aquestes instruccions no podem garantir que siguin utilitzades, perquè no sabem qui podrà fer la feina d'integració necessària. Quins fitxers traduir Els únics fitxers que cal traduir són els acabats en ".tt" o ".msg" (si el vostre sistema operatiu no us mostra les extensions dels fitxers digueu-li que us les mostri). A part dels fitxers acabats en ".tt" o en ".msg" hi ha aquest propi fitxer, traduccio.txt que explica com traduir. No cal tocar-lo, però el podeu conservar per consultar-lo. Tots els altres fitxers (els acabats en ~ , o en # , o qualsevol altre) no cal tocar-los per a res, i de fet si voleu els podeu esborrar. No hi haurien de ser (són còpies de seguretat de versions antigues, que algun editor ha fet automàticament). En una ocasió han causat problemes, o sia que esborreu-los tranquilament si en trobeu. Com obtenir els fitxers. Si llegiu això deu ser que sou candidats a traductors (gràcies !!!). I us deveu tenir un arxiu ca.tar.gz o ca.zip que conté els originals en català. Primer cal extreure els fitxers de l'arxiu que heu rebut (si no ho heu fet ja). Podeu usar qualsevol descompressor que entengui el format tar.gz (que són molts) o .zip (que també n'hi ha força). Un fitxer .tar.gz és un arxiu comprimit que conté dintre uns quants fitxers. És més còmode per enviar-ho per internet com un sol fitxer. Només cal descomprimir-lo de manera que quedin tots els fitxers a una carpeta. Si teniu el programa tar, podeu posar a MSDOS o en un terminal, des del directori on hi ha l'arxiu: tar -xzvf ca.tar.gz o si teniu un descompressor gràfic, podeu obrir l'arxiu (ca.tar.gz o ca.zip) amb el descompressor i dir-li que extregui tots els fitxers. Un cop teniu els fitxers a una carpeta és qüestió d'anar-los traduint un a un. Deixeu el mateix nom de fitxer que tenien, no traduiu cap nom de fitxer, que si no el programa no el trobaria. Com traduir els fitxers ".msg" Els fitxers ".msg" són textos que van als missatges que s'envien per correu. Per a traduir-los només cal obrir-los des d'un editor de text (vi, emacs, wordpad, el que més us agradi). També podeu fer servir un processador de textos, com el OpenOffice o similar, però no ho recomano, no necessiteu ni un 5% de les funcionalitats d'un processador de textos i si el feu servir us heu de recordar de desar el fitxer en el format original (text ISO-8859-1 estil unix, o sia amb LF per marcar salts de línia). Aquests fitxers (igual que el que esteu llegint ara) estan codificats en ISO-8859-1, que és l'estandard que defineix la correspondència entre cada caràcter i el codi que l'identifica. Això no hauria de ser problema en la majoria de sistemes d'Europa occidental, però alguns poden estar configurats per usar UTF-8 per omissió, i llavors haureu de dir-li al vostre editor de textos que aquest fitxer està en ISO-8859-1 (per exemple, amb emacs és Ctrl-X,Ret,r en altres pot ser a l'opció de propietats del menú "fitxer" o al quadre de diàleg d'obrir el fitxer). Si no encerteu la codificació no veureu bé els accents del text (ni altres lletres com la ç, ñ, o les que portin dièresis, el punt volat, etc.) i els accents, ç, etc. que escriviu no es veuran bé als missatgs enviats. Però si no sabeu quina codificació esteu usant i veieu bé els accents i ç, el normal és que ja estigueu fent servir la correcta, ISO-8859-1. També pot passar que no vegeu bé els salts de línia. Potser al final de cada línia trobeu símbols estranys o us apareix el fitxer com si només tingués una línia. Els salts de línia en aquest fitxer estan codificats com en unix, gnu, BSD, BeOS, Amiga, RISC OS i Mac OS X, és a dir amb el codi ASCII 10 (LF, salt de línia). Si utilitzeu algun d'aquests sistemes operatius, no hi ha problema. El Commodore, Apple II i Mac OS (antic) usava el caracter ASCII 13 (CR, retorn de carro) per indicar salt de línia . I el Microsoft Windows utilitza dos caràcters per a cada salt de línia: CR seguit de LF (ASCII 13, ASCII 10). Si useu MS Windows heu d'anar amb compte de quin programa feu servir per editar el fitxer. Diu que el wordpad entén els fitxers d'Unix però jo no ho he provat. Ho podeu provar. En tot cas assegureu-vos de desar el resultat en format Unix (salts de línia com a ASCII 10, LF). Si no podeu aviseu quan envieu la traducció. Canviar tots els salts de línia d'un fitxer de codificació windows a unix o de unix a windows no em costa massa, però si el vostre editor deixa algunes línies amb codificació unix i algunes en codificació windows pot ser més complicat. El contingut del fitxer és text que es pot traduir sense més (millor si no poseu més de 65 caràcters a cada línia, però no és molt important). Però hi ha parts especials del fitxer que comencen amb els dos caràcters "[%" i acaben amb "%]". El text entre aquestes marques no s'ha de traduir. Però hi ha una excepció. El text entre cometes que segueix a " cap.Subject = " sí que s'ha de traduir encara que estigui dintre de [% %], i l'heu de deixar en una sola línia. Això es posarà com assumpte del missatge. Com traduir els fitxers .tt Els fitxers .tt són fitxers html que l'aplicació combina per construir les pàgines web. Dintre l'html hi ha també marques [% %] i en general no s'ha de traduir el seu contingut, excepte el text entre cometes que segueix a "titol =", que és el titol que sortirà a la finestra del navegador quan visitin la plana (i també s'utilitzarà per omissió per a marcadors). El fitxer errors.tt és una excepció i en parlarem més envant. I els fitxers signar_personal.tt i signar_entitat.tt no són html correcte estrictament parlant (són plantilles que utilitza el program per generar html correcte, però a més de l'html inclouen codis per al programa que no són html). Això vol dir que aquests tres fitxers poden donar més problemes amb editors html i és millor editar-los amb un editor de text (vi, emacs, bloc de notes...). Els altres .tt en poden donar menys (però depen de cada editor HTML). Els fitxers .tt estan codificats en UTF-8, que és un estàndard que admet molt més caràcters que l'ISO-8859-1 per facilitar que els signants posin comentaris en (quasi) qualsevol llengua. Si el vostre editor no entén que està en UTF-8 no veureu bé els accents, les dièresis i lletres com ara ç, ñ, o el punt volat. Cal que li digueu que el fitxer està en UTF-8, o si el vostre editor no enten UTF-8 cal usar un altre programa. Per exemple en emacs se li pot dir amb Ctrl-X, Ret, r. Sembla ser que el notepad (bloc de notes del windows) enten UTF-8 si esculls aquesta codificació en obrir el fitxer (no sé si totes les versions de notepad). L'HTML és un llenguatge de marques. Això vol dir que els fitxers HTML són fitxers de text amb marques que indiquen al navegador què és cada part del text (i per tant què fer i com mostrar-lo). Les marques consisteixen en una etiqueta al principi del tros de text i una al final, que delimita el que s'anomena un element. Si les etiquetes de principi i final de l'element van seguides sense res al mig es pot posar una única etiqueta. Les etiquetes comencen pel caràcter "<" i acaben en el caràcter ">". Com a norma general les etiquetes (el text entre "<" i ">" no s'han de traduir). Però en l'interior de les etiquetes hi pot haver atributs, que són paraules seguides pel símbol "=" i després un valor entre cometes. Alguns d'aquests valors entre cometes després de = s'han de traduir i alguns no. Els que s'han de traduir són els que segueixen a alt title Els que no s'han de traduir són els que segueixen a id name href for type value size style tabindex colspan rowspan rows cols maxlength class I si trobeu valors d'atributs que no surten a cap de les dues llistes no els traduïu, però si voleu apunteu-vos-ho per preguntar-ho després. Recordeu que l'original és català, per tant tot el text que estigui en anglès o no siguin paraules catalanes ja sabeu que no s'ha de traduir. El text que estigui en català depèn, cal aplicar el que hem dit. L'HTML també pot contenir el que s'anomena entitats de caràcters. Comencen pel caràcter & i acaben per ;. Representen un sol caràcter que per algun motiu no era pràctic posar allà. Per exemple si vols posar unes cometes en el valor d'un atribut, no pots perquè voldria dir que tanques les cometes dintre de les que està el valor de l'atribut. Llavors pots substituir les cometes per l'entitat de caracter ". Si al text volguessis posar el símbol "<" no podries perquè seria com començar una etiqueta, i per tant poses < (de "less than"), etc. Normalment no us n'heu de preocupar gaire. Formaran part de textos (en general traduïbles) i vosaltres substituireu tot el text per la traducció, i no crec que necessiteu posar cap entitat de caràcter. L'únic que pot dificultar una mica la comprensió si trobeu escrit per exemple "camió" per comptes de "camió". Però n'hi hauria prou amb canviar-ho per "camión", "truck" o "camione" o el que toqui en la llengua a la que traduïu. Les entitats de caràcters no s'haurien de fer servir dintre de maques [% %], perquè el contingut de [% %] no és html sino codi per a l'aplicació. He intentat eliminar les entitats de caracters al màxim possible en l'original català per facilitar la traducció amb editors de text. Hi ha un cas especial en el fitxer baners.tt . Aquest fitxer és html amb codis [% %] com els altres fitxers .tt, però conté exemples d'html que volem que es vegin al navegador com a codi font html (per a que la gent ho pugui copiar a les seves pàgines per promocionar la recollida de signatures). I aquest codi html que no volem que el navegador interpreti sinó que el mostri l'hem d'escriure amb entitats de caracters. No us hi encaparreu. Per a traduir-ho només heu de saber que al fitxer baners.tt hi ha alguns fragments que comencen per
i acaben per
. Del contingut d'aquestes seccions només heu de traduir el text entre cometes que segueix a alt=. La resta del fragment el deixeu tal com està. I la resta del fitxer que no són aquests fragments els traduiu com un altre fitxer .tt. Per editar aquests fitxers podeu usar un editor HTML o un editor de text, però seria preferible un editor de text. Els comentaris anteriors suposen que esteu fent servir un editor de text. Els editors HTML tenen l'avantatge que faciliten treballar amb HTML (substitueixen les entitats de caràcter pels caràcters correctes, alguns marquen amb colors els elements, atributs i llurs valors, altres permeten editar la pàgina sense veure les marques, etc.). Però tenen l'inconvenient que a vegades no respecten prou fidelment el contingut, i com que a part de l'html tenim marques que l'aplicació utilitza per introduir valors al l'html, doncs segons què faci l'editor HTML podria resultar en un fitxer que no funcioni. En concret els fitxers errors.tt, signar_personal.tt i sigar_entitat.tt és millor editar-los en un editor de text (emacs, vi, wordpad, gedit, ultraedit...) que en un editor HTML (amaya, mozilla composer, nvu, quanta...). Els altres fitxers .tt es poden editar en un editor de text o en un editor HTML que no faci gaire canvis a l'original, però només hem provat l'Amaya com a editor HTML i en fa masses, no queden bé del tot. Els fitxers signar_personal.tt i signar_entitat.tt tenen uns atributs maxlength que no s'han de traduir però l'amaya els esborra quan graves el fitxer (perquè "creu" que són incorrectes al no contenir números, no "sap" que l'aplicació els deixarà correctes abans de publicar-los). La resta els deixa quasi bé però mou les marques i del principi i del final de cada fitxer, de manera que les pàgines resultants no són vàlides. El fitxer errors.tt dóna problemes si l'amaya ajunta dues línies en una. Si proveu altres editors HTML vigileu que no facin el mateix. Dels altres editors HTML no en sabem gran cosa. El Mozilla composer possiblement no serveixi, però no ho sabem segur. El més recomanable per a tots els fitxer .tt és provar d'editar-los amb un editor de text que accepti UTF-8 (vi, kedit, gedit, notepad, emacs...). Si us hi trobeu còmodes perfecte, és el més segur. Si ho trobeu massa complicat, podeu provar de traduir un fitxer amb un editor HTML i enviar-lo a veure com ha quedat abans de fer-los tots (el gracies.tt és petitet i pot servir per fer la prova). Si ho feu amb un editor HTML no oblideu de traduir els valors dels atributs alt i title de les imatges (poden no ser visibles a simple vista en un editor HTML). En la mesura del possible intenteu respectar l'estructura de l'html (no poseu ni traieu elements) i canvieu només el text. Intenteu no ajuntar ni dividir línies, especialment dintre de les seccions marcades amb [% i %]. Com traduir errors.tt El fitxer errors.tt és un fitxer com els altres .tt. El que passa és que defineix unes variables que contenen els missatges d'error. Conté molt poc codi html i molt codi entre [% %]. De la part que té entre [% %] sí que s'han de traduir els missatges que hi ha entre cometes (però no els noms dels missatges que hi ha fora de les cometes, abans de cada missatge, ni cap altra cosa dintre de [% %] que no estigui dintre de cometes). També s'ha de traduir la mica de text que hi ha en un paràgraf html (entre

i

). Hi ha uns noms de variable dintre dels missatges entre cometes que hi ha dintre de [% %]. Aquests noms de variable comencen pel símbol "$", seguit de "{", llavors el nom de la variable (amb possibles punts) i llavors "}". Els noms de variable s'han de deixar sense traduir, com estan, tot i que es poden moure de lloc dintre la frase si en traduir la frase el valor que representen ha d'anar a un altre lloc en la gramàtica de l'idioma al que traduïm. Hi ha unes línies que assignen unes variables a unes altres (contenen un nom de missatge sense cometes, un símbol igual i un altre nom de missatge sense cometes). Aquestes s'han de deixar com estan, una a cada línia. Si s'ajunten les línies que estan separades a l'original després no funcionarà. Si s'ajunten altres línies dintre de [% %] també pot fer fallar la gestió d'errors. Per això és millor traduir aquest fitxer amb un editor de text que amb un editor HTML. Hi ha molt poc html que us pugui molestar i qualsevol editor HTML pot fer maleses juntant línies que no s'han de juntar. La meva intenció era fer-ho de manera que es pogués editar amb un editor HTML però l'experiència amb la traducció a l'occità demostra que no va gaire bé fer-ho així. Flux de treball El més fàcil és seguir els passos següents: - descarregar l'arxiu ca.tar.gz (o ca.zip) - descomprimir-lo per extreure els fitxers .tt i .msg a un directori - traduir un .msg que no sigui ultim.msg (per exemple ok.msg) amb un editor de text (ISO-8859-1) - traduir un .tt que no sigui el errors.tt (per exemple gracies.tt) amb un editor de text o si ho preferiu amb un editor HTML (UTF-8) - enviar els dos fitxers a xdrudis@tinet.cat perquè els copiï a un nou directori de la llengua a la que traduïu al servidor, a l'aplicació de proves. - quan l'xdrudis ho hagi fet podeu mirar http://collserola.org/signaturesEnProves/ i triar l'idioma que hagueu traduït. Sortirà tot en català menys la part que heu enviat traduïda. Useu la web de manera que us enviï un correu com el que heu traduït. Si funciona bé i no veieu errors llavors sabeu que ho heu fet de la manera correcta, si no podem comentar els problemes i tornar-ho a provar. - Quan aquests dos fitxers funcionin, anar traduint la resta. - Quan estiguin tots traduïts els podeu empaquetar en un fitxer (si us costa posar-los en un arxiu comprimit els podeu enviar un a un) i enviar-los a l'xdrudis per publicar-los a l'aplicació de proves, provar que tot funcioni, si hi ha errors corregir-los i tornar-los a enviar fins que no n'hi hagi. Si teniu dubtes podeu consultar-me a xdrudis@tinet.cat, sobre tot si feu servir gnu/linux. Però jo no faig servir windows ni MacOS X ni conec els programes d'aquests sistemes operatius, per tant és possible que no us pugui ajudar en tot. Si coneixeu gent que fa servir els mateixos programes que vosaltres, potser us puguin ajudar si els ensenyeu aquestes instruccions. Gràcies per la col·laboració i ànims que no és tan complicat com sembla llegint aquest rotllo.