Hashtags amb ela geminada amb UTF-8

Trobo al Twitter una piulada que reclama que l’ela geminada sigui reconeguda com una lletra més (en realitat, seria un trígraf, però no ens anem a posar massa gramaticals, que hi ha gent que encara no s’ha pres el cafè):

Efectivament, si tracteu d’escriure un hashtag amb ela geminada, Twitter ignorarà la cadena a partir del punt volat, cosa que us obligarà a buscar solucions imaginatives, com ara suprimir el punt; això deixa el català en una situació difícil a l’hora de respectar-ne l’ortografia en aquesta xarxa social (i potser en d’altres amb el mateix sistema d’etiquetes). Com que Twitter ja va solucionar el problema de les vocals accentuades, de la ce trencada i de la ena palatal castellana (ñ), sembla lògic que també pugui solucionar aquest petit detall de la nostra llengua.

Mentre repiulo la petició com a bon professor de català, em ve al cap que la codificació UTF-8 inclou, en un sol caràcter, la primera ela i el punt volat (ŀ, diferent de ) i decideixo fer la prova: tallarà Twitter el hashtag #iŀluminat (amb el dígraf ŀ en un únic caràcter) com ho fa amb #il·luminat (emprant-hi tres caràcters separats)? Vet aquí el resultat:

Així, doncs, descobreixo que Twitter ja contempla el caràcter ŀ com una lletra normal i no hi ha, per tant, cap problema a l’hora d’emprar la ela geminada en les etiquetes: només cal saber com escriure aquest caràcter.

En el meu cas, és extremadament fàcil: la combinació [alt gr] + l insereix aquest famós caràcter ŀ. Però, és clar, als meus ordinadors tinc definit el teclat espanyol, variant catalana, cosa molt senzilla de fer en qualsevol sistema GNU/Linux: els pobres mortals que seguiu emprant sistemes privatius continuareu privats d’emprar etiquetes ortogràficament correctes (fins que trobeu una forma còmoda de generar aquest caràcter).

Per tant, sospito que la campanya #elageminada serà desestimada per Twitter tan bon punt els seus tècnics s’informin mínimament sobre el problema i descobreixin que, en realitat, ja està resolt i que només cal emprar un caràcter que ja existeix a la codificació UTF-8. El que caldria fer, en realitat, és buscar una forma fàcil per generar ŀ des de la resta de plataformes i, si no existeix, demanar que la creïn.

 

Reedició 10-04-15 a les 9.12

Gràcies a una piulada del Jordi Malach, m’assabento que el caràcter combinat ŀ està desfasat i desaconsellat. Ho hauré de revisar, doncs:

 

Gràcies, Jordi!

Reedició 10-04-15 a les 11.11

Una mica després, el Joan Montané (@unjoanqualsevol) s’hi afegeix a la conversa amb tot d’explicacions. En aquest cas, no copio els seus tuits perquè us resultarà més còmode llegir els articles que ha dedicat al tema. Si els llegiu, veureu que serà difícil trobar algú de millor informat que ell:

Us en recomano la lectura, perquè és un tema complex que relaciona ortografia, tipografia, codificació i maquinari, i Montané ho explica molt detalladament. A més a més, ens ha comentat que la solució, pel que fa a Twitter, podria estar ben a prop:

Moltes gràcies pels aclariments, Joan!

Anuncis
Aquesta entrada s'ha publicat en contradiccions i etiquetada amb , , , . Afegiu a les adreces d'interès l'enllaç permanent.

5 respostes a Hashtags amb ela geminada amb UTF-8

  1. Josep ha dit:

    Bé, encara que ho resolguin, quedaria pendent el guió, el volat. ;-)

  2. SiscoGarcia ha dit:

    iuuuuuju!!!!

    Quina gran descoberta això de la codificació -estàndard- UTF-8… el que no puc entendre és que estiga desfasat; potser per això android ja no l’incorpora darrerament (fins no fa gaire hi havia l’opció ŀ i ara ha estat substituïda per l·l)?

    Crec que el problema en aquest cas, com en tants altres, és que les grans corporacions pretenen passar de tota mena de «control», fins i tot d’aquells acords que es prenen per tal d’aclarir-nos millor (parlo dels estàndards ISO).

    Que deixen treballar a aquesta gent i que s’arribe a algun acord que fàcilment puga implementar tothom.

Els comentaris estan tancats.