Skip to content

Commit

Permalink
[ca] enable rules
Browse files Browse the repository at this point in the history
  • Loading branch information
jaumeortola committed Oct 24, 2024
1 parent b7ba7e0 commit 86042db
Show file tree
Hide file tree
Showing 7 changed files with 90 additions and 15 deletions.
Original file line number Diff line number Diff line change
Expand Up @@ -472,7 +472,7 @@ public String adaptSuggestion(String s) {

private final List<String> spellerExceptions = Arrays.asList("San Juan", "Copa América", "Colección Jumex", "Banco Santander",
"San Marcos", "Santa Ana", "San Joaquín", "Naguib Mahfouz", "Rosalía", "Aristide Maillol", "Alexia Putellas",
"Mónica Randall", "Vicente Blasco Ibáñez");
"Mónica Randall", "Vicente Blasco Ibáñez", "Copa Sudamericana");

@Override
public List<String> prepareLineForSpeller(String line) {
Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -16,6 +16,7 @@ Cabanilles Cabanilles NPCNSP0
Clyde Clyde NPCNSP0
Concord Concord NPCSG00
Cuisenaire Cuisenaire NPCNSP0
Dalloway Dalloway NPCNSP0
F-Droid F-Droid NPCNO00
Finkielkraut Finkielkraut NPCNSP0
Guirilàndia Guirilàndia NPFSG00
Expand Down Expand Up @@ -114,6 +115,8 @@ plagiadores plagiador AQ0FP0
plagiadores plagiador NCFP000
plagiadors plagiador AQ0MP0
plagiadors plagiador NCMP000
polifonisme polifonisme NCMS000
polifonismes polifonisme NCMP000
portaesquer portaesquer NCMS000
portaesquers portaesquer NCMP000
postliterari postliterari AQ0MS0
Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -73,7 +73,7 @@
<!ENTITY error_darrere_haver "liat|conduit|d|respòs|sapigut|diferencia|detentat">
<!ENTITY diacritics_00 "republica|republiques|numero|radio|termometre|termometres|especie|especies">
<!ENTITY diacritics_01 "rabia|rabies|hostia|hosties|quilometre|quilometres|arbitre|arbitres|cronometre|cronometres|eutanasia|eutanasies|pifia|pifies">
<!ENTITY diacritics_02 "amplia|amplies|perdo|avio|presencia|presencies|evidencia|evidencies|especifica|especifiques|matricula|matricules|adultera|adulteres">
<!ENTITY diacritics_02 "amplia|amplies|perdo|avio|presencia|presencies|evidencia|evidencies|especifica|especifiques|matricula|matricules|adultera|adulteres|valida|invalida|valides|invalides">
<!ENTITY diacritics_03 "mati|figuri"> <!-- |denuncia|denuncies -->
<!ENTITY filename_extensions "ai|asp|aspx|avi|bak|bat|bmp|cab|cfg|cgi|com|css|csv|dat|db|dbf|dll|doc|docx|env|eps|exe|flv|gif|htm|html|ibooks|ico|ics|ini|indd|jar|java|jnl|jpeg|jpg|js|jsp|lnk|md|mdb|mid|mov|mp3|mp4|mpa|mpg|odf|odp|ods|odt|pdf|php|pl|png|pps|ppt|pptx|ps|psd|py|rar|rss|rtf|scss|sh|shtml|sql|stl|svg|sys|tar|tif|tiff|tmp|ts|txt|wav|wma|xhtml|xls|xlsx|xml|xsl|yaml|yml|zip|zipx|7z|xsd">
<!ENTITY nbsp "&#x00A0;"> <!-- no-break space -->
Expand Down
Original file line number Diff line number Diff line change
@@ -1,5 +1,6 @@
#Catalan multiwords file used for chunking
#separatorRegExp=[\t;]
Eveli Torent;NPMSSP0
Mrs. Dalloway;NPFSSP0
Hazte Oír;NPCNO00
José Antonio Zarzalejos;NPMSSP0
Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -11,6 +11,7 @@ Cabanilles
Clyde
Concord
Cuisenaire
Dalloway
F-Droid
Finkielkraut
Guirilàndia
Expand Down Expand Up @@ -103,6 +104,8 @@ plagiador
plagiadora
plagiadores
plagiadors
polifonisme
polifonismes
portaesquer
portaesquers
postliterari
Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -28761,6 +28761,18 @@ Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA
<example correction="ens estimaves|les estimaves|els estimaves">Tothom t'estimava i sabíem que <marker>es estimaves</marker></example>
</rule>
</rulegroup>
<rule id="H_IHA" name="h iha -> hi ha">
<pattern>
<token>h</token>
<token regexp="yes">iha.*</token>
</pattern>
<filter class="org.languagetool.rules.ca.FindSuggestionsFilter" args="wordFrom:2 desiredPostag:VA..3... suppressMatch:true"/>
<message>Error d'ortografia.</message>
<suggestion>hi {suggestion}</suggestion>
<example correction="Hi havia"><marker>H ihavia</marker> un problema.</example>
<example correction="hi ha">N'<marker>h iha</marker> quatre.</example>
<example correction="hi hagués">És possible que <marker>h ihagues</marker> un problema.</example>
</rule>
<rulegroup id="CA_SPLIT_WORDS" name="paraules mal partides">
<antipattern>
<token>sant</token>
Expand Down Expand Up @@ -29396,7 +29408,7 @@ Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA
</rule>
</category>
<category id="CONFUSIONS" name="Confusions" type="misspelling">
<rulegroup id="ES_REVELI_N" name="es rebel·li'n -> es rebel·lin" default="temp_off">
<rulegroup id="ES_REVELI_N" name="es rebel·li'n -> es rebel·lin">
<rule>
<pattern>
<token>es</token>
Expand Down Expand Up @@ -29437,15 +29449,15 @@ Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA
<example correction="miren">Es <marker>mira'n</marker> de reüll.</example>
</rule>
</rulegroup>
<rule id="EN_DURANT" name="en durant -> durant" default="temp_off">
<rule id="EN_DURANT" name="en durant -> durant">
<pattern>
<token>en</token>
<token>durant</token>
</pattern>
<message>¿Volíeu dir <suggestion>durant</suggestion> o <suggestion>en</suggestion>?</message>
<example correction="durant|en">Progressivament disminuïm el temps <marker>en durant</marker> el qual mantenim l'atenció.</example>
</rule>
<rule id="EMPORTA_T" name="emportat -> emporta't" default="temp_off">
<rule id="EMPORTA_T" name="emportat -> emporta't">
<pattern>
<token postag="SENT_START|_PUNCT.*" postag_regexp="yes"/>
<marker>
Expand Down Expand Up @@ -50253,15 +50265,15 @@ Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA
<example>de què férem esment al Capítol II,</example>
<example>de la qual fa menció a De Exilio, </example>
</rule>
<rule id="EN_PRESO" name="en presó -> a la presó" default="temp_off">
<rule id="EN_PRESO" name="en presó -> a la presó">
<pattern>
<token regexp="yes" inflected="yes">entrar|ingresar|ficar</token>
<marker>
<token>en</token>
<token>presó</token>
</marker>
</pattern>
<message>És més adequat usar <suggestion>a la presó</suggestion>.</message>
<message>És més adequat dir <suggestion>a la presó</suggestion>.</message>
<example correction="a la presó">El jutge decidirà si entra <marker>en presó</marker>.</example>
</rule>
<rule id="FER_CAS_OMIS_A_DE" name="fer cas omís a -> fer cas omís de">
Expand Down Expand Up @@ -52777,6 +52789,10 @@ Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA
<token regexp="yes" min="0">\p{P}</token>
<token regexp="yes">\p{Lu}.*</token>
</antipattern>
<antipattern>
<token postag="&pronom_feble;" postag_regexp="yes"/>
<token postag="UNKNOWN"/>
</antipattern>
<pattern>
<marker>
<token postag="UNKNOWN" regexp="yes">....*an<exception postag="_possible_nompropi"/><exception regexp="yes">[@#].*|liban</exception></token>
Expand Down Expand Up @@ -57615,6 +57631,11 @@ Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA
</rule>
</rulegroup>
<rulegroup id="QUE_SENSE_ACCENT" name="què/que: no s'ha d'accentuar">
<antipattern>
<token regexp="yes">el|l</token>
<token>què</token>
<token>diran</token>
</antipattern>
<rule>
<antipattern>
<token regexp="yes">una?</token>
Expand All @@ -57626,14 +57647,31 @@ Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA
<token min="0" inflected="yes">voler</token>
<token postag="V.N.*" postag_regexp="yes"/>
</antipattern>
<antipattern>
<token inflected="yes">haver</token>
<token>fet</token>
<token skip="3">què</token>
<token>?</token>
</antipattern>
<antipattern>
<token>què</token>
<token>més</token>
</antipattern>
<antipattern>
<token regexp="yes" skip="6">què|qui|com|on|quan</token>
<token>sinó</token>
<token>què</token>
<example>Sense pensar què diuen les lleis, sinó què està bé.</example>
<example>Es va qüestionar no pas on era sinó què havia fet.</example>
</antipattern>
<pattern>
<marker>
<token regexp="yes">encara|ja|fins|més|els|mentre|tant|sense|malgrat|sinó|sí|tal|fets?|alhora</token>
<token>què</token>
</marker>
<token><exception>?</exception></token>
</pattern>
<message>No s'ha d'accentuar.</message>
<message>Potser no s'ha d'accentuar. Sí que s'accentua si equival a 'quina cosa'.</message>
<suggestion><match no="1"/> que</suggestion>
<example correction="ja que"><marker>ja què</marker> són així</example>
<example correction="els que">Són <marker>els què</marker> ho fan.</example>
Expand All @@ -57642,6 +57680,7 @@ Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA
<example>No saben ja què fer.</example>
<example>No saben encara què volen fer.</example>
<example>comprovem una vegada més què passa</example>
<example>Quan no saben ja què més fer, reaccionen a crits</example>
</rule>
<rule>
<pattern>
Expand Down Expand Up @@ -57720,6 +57759,21 @@ Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA
<token inflected="yes" skip="1">saber</token>
<token>què</token>
</antipattern>
<antipattern>
<token>a</token>
<token inflected="yes" skip="1">saber</token>
<token>què</token>
</antipattern>
<antipattern>
<!-- més verbs, ambigu -->
<token regexp="yes" inflected="yes">importar|preguntar|exposar</token>
<token>què</token>
</antipattern>
<antipattern>
<token>què</token>
<token min="0" max="4" regexp="yes">\.|…</token>
<token regexp="yes">\?|\!</token>
</antipattern>
<antipattern>
<marker>
<token>què</token>
Expand Down Expand Up @@ -57782,11 +57836,12 @@ Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA
<example>Calia explicar què se'n feia dels excedents</example>
<example>Volem saber què en penses.</example>
<example>O vés a saber què.</example>
<example>Anava a comprar vés a saber què i em deixava allà sola.</example>
</rule>
<rule>
<antipattern>
<token postag="SPS00|LOC_PREP|SENT_START|_PUNCT.*" postag_regexp="yes"/>
<token min="0">tot</token>
<!-- <token postag="SPS00|LOC_PREP|SENT_START|_PUNCT.*" postag_regexp="yes"/>
<token min="0" max="2" regexp="yes">tot|i</token>-->
<token regexp="yes">allò|açò|això</token>
<token skip="-1">què</token>
<token>?</token>
Expand All @@ -57803,6 +57858,8 @@ Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA
<example>Amb allò què podíem fer?</example>
<example>Després d'això què podíem fer?</example>
<example>Això què és?</example>
<example>I això què és?</example>
<example>I tot això què és?</example>
</rule>
<rule>
<pattern>
Expand All @@ -57818,7 +57875,7 @@ Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA
<suggestion>que</suggestion>
<example correction="Que"><marker>Què</marker> a mi m'agradaria que passés això?</example>
</rule>
<rule default="temp_off">
<rule>
<antipattern>
<token skip="-1">què</token>
<token>?</token>
Expand Down Expand Up @@ -74325,11 +74382,15 @@ Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA
</rulegroup>
</category>
<category id="INCORRECT_EXPRESSIONS" name="Expressions incorrectes" type="grammar">
<rulegroup id="DONAR_IGUAL" name="donar igual -> ser igual" default="temp_off">
<rulegroup id="DONAR_IGUAL" name="donar igual -> ser igual">
<antipattern>
<token>igual</token>
<token postag="NC.S.*" postag_regexp="yes"/>
</antipattern>
<antipattern>
<token>es</token>
<token inflected="yes">donar</token>
</antipattern>
<rule>
<pattern>
<marker>
Expand All @@ -74342,7 +74403,8 @@ Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA
<message>Expressió incorrecta.</message>
<suggestion>\1 <match no="2" postag_regexp="yes" postag="VM(.*)" postag_replace="VS$1">ser</match> igual</suggestion>
<suggestion>tant \1 <match no="2" postag_regexp="yes" postag="VM(.*)" postag_replace="VS$1">ser</match></suggestion>
<example correction="m'és igual|tant m'és">Això ara <marker>em dóna igual</marker>.</example>
<suggestion>tant \1 <match no="2" postag_regexp="yes" postag="VM(.*)" postag_replace="VM$1">fer</match></suggestion>
<example correction="m'és igual|tant m'és|tant em fa">Això ara <marker>em dóna igual</marker>.</example>
</rule>
<rule>
<pattern>
Expand All @@ -74354,7 +74416,9 @@ Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA
<message>Expressió incorrecta.</message>
<suggestion><match no="1" postag_regexp="yes" postag="VM(.*)" postag_replace="VS$1">ser</match> igual</suggestion>
<suggestion>tant <match no="1" postag_regexp="yes" postag="VM(.*)" postag_replace="VS$1">ser</match></suggestion>
<example correction="és igual|tant és">Això ara <marker>dóna igual</marker>.</example>
<suggestion>tant <match no="1" postag_regexp="yes" postag="VM(.*)" postag_replace="VM$1">fer</match></suggestion>
<example correction="és igual|tant és|tant fa">Això ara <marker>dóna igual</marker>.</example>
<example>La maduració del cervell no es dóna igual, en el mateix moment, en tot el seu conjunt.</example>
</rule>
</rulegroup>
<rule id="SENPORTA_S_EMPORTA" name="senporta -> s'emporta">
Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -663,4 +663,8 @@ resistència antimicrobiana=resistència als antimicrobians Expressió preferibl
resistència antibiòtica=resistència als antibiòtics Expressió preferible.
talego=garjola|gàbia|ombra Expressió col·loquial no admesa en els diccionaris.
trullo=garjola|gàbia|ombra Expressió col·loquial no admesa en els diccionaris.
a esborrat=ha esborrat El verb 'haver' s'escriu amb 'h'.
a esborrat=ha esborrat El verb 'haver' s'escriu amb 'h'.
directe o indirectament=directament o indirectament|directament o indirecta
directe o indirecta=directe o indirecte|directa o indirecta Error de concordança.
directa o indirecte=directa o indirecta Error de concordança.
directament o indirecte=directament o indirecta Error de concordança.

0 comments on commit 86042db

Please sign in to comment.