Skip to content

Commit

Permalink
[ca] improve rules
Browse files Browse the repository at this point in the history
  • Loading branch information
jaumeortola committed Jul 28, 2023
1 parent 0f79d20 commit 83d9446
Show file tree
Hide file tree
Showing 5 changed files with 109 additions and 24 deletions.
Original file line number Diff line number Diff line change
Expand Up @@ -1461,6 +1461,13 @@ Copyright (C) 2012 Jaume Ortolà i Font
</rulegroup>
<rulegroup id="nom_vocals" name="el nom de les vocals">
<rule>
<antipattern>
<token postag="V.[MGN].*" postag_regexp="yes"/>
<!-- falta un guionet -->
<token>la</token>
<token>a</token>
<token postag="V.N.*|contraccio|D.*" postag_regexp="yes"/>
</antipattern>
<pattern>
<token>la</token>
<marker>
Expand Down Expand Up @@ -12976,7 +12983,7 @@ Copyright (C) 2012 Jaume Ortolà i Font
<token postag="DN.*" postag_regexp="yes"/>
</antipattern>
<antipattern>
<token postag="V.M.*" postag_regexp="yes"/>
<token postag="V.[MGN].*" postag_regexp="yes"/>
<!-- falta un guionet -->
<token>la</token>
<token>a</token>
Expand Down
Original file line number Diff line number Diff line change
@@ -1,5 +1,7 @@
#Catalan multiwords file used for chunking
#separatorRegExp=[\t;]
Reform Act;NPFSO00
fig.;NCFN00
una, grande y libre;NCFS000
Mireia Vehí;NPFSSP0
a soles;LOC_ADV
Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -23453,11 +23453,18 @@ Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA
<example correction="en dejú">Has de venir a fer l'anàlisi <marker>en dejuni</marker>.</example>
</rule>
</rulegroup>
<rule id="HO_HA_HI_HA" name="ho ha -> hi ha" default="temp_off">
<rule id="HO_HA_HI_HA" name="ho ha -> hi ha">
<antipattern>
<token inflected="yes">haver</token>
<token regexp="yes">de|d'</token>
</antipattern>
<antipattern>
<token inflected="yes">haver</token>
<!-- participi amb falta d'ortografia -->
<token postag="UNKNOWN" regexp="yes">\p{Ll}.*t</token>
<example>Que com ho he sapigut?</example>
<example>Un conegut ho havia retwittejat.</example>
</antipattern>
<pattern>
<marker>
<token>ho</token>
Expand Down Expand Up @@ -47202,21 +47209,42 @@ Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA
<example>Hibridats molt més fàcilment que si fossin autofecundats.</example>
</rule>
<rule default="temp_off">
<antipattern>
<token regexp="yes" skip="6">igual|més|menys|tant|tan</token>
<token>que<exception scope="previous">ja</exception></token>
<token>si</token>
<example>No és tan vàlid que si ho diu un adult.</example>
</antipattern>
<antipattern>
<token regexp="yes">igual|apa|oi|ah|,</token>
<token>que</token>
<token>si</token>
</antipattern>
<antipattern>
<token inflected="yes" regexp="yes">preguntar|demanar</token>
<token>que</token>
<token inflected="yes" regexp="yes" skip="-1">preguntar|demanar</token>
<token>que<exception scope="previous">ja</exception></token>
<token>si</token>
</antipattern>
<antipattern>
<token>que</token>
<token skip="-1">si</token>
<token>?</token>
</antipattern>
<antipattern>
<token skip="-1">si</token>
<token>.</token>
<token>.</token>
<token>.</token>
</antipattern>
<antipattern>
<token skip="-1">si</token>
<token>&ellipsis;</token>
</antipattern>
<antipattern>
<token>tot</token>
<token>just</token>
<token>si</token>
</antipattern>
<pattern>
<token postag="CS|LOC_CONJ|PR.*" postag_regexp="yes" regexp="yes">que|perquè|puix|car<exception scope="next" postag="V.[ISM].*" postag_regexp="yes"/><exception scope="next">no</exception></token>
<token postag="RG|LOC_ADV|_IS_URL" postag_regexp="yes" min="0" max="4"/>
Expand Down Expand Up @@ -51378,6 +51406,29 @@ Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA
</rule>
</rulegroup>
<rulegroup id="PRONOMS_FEBLES_DARRERE_VERB" name="Formes incorrectes darrere de verb: *veure-lo, *emporteu-vos-ne">
<antipattern>
<token regexp="yes">la|les</token>
<token min="0" max="5" postag="R.*|A.*|V.P.*|LOC_ADV" postag_regexp="yes"/>
<token postag="N.*|DN.*" postag_regexp="yes"/>
<example>en les quals hom inclou la molt important balança de serveis</example>
</antipattern>
<antipattern>
<token regexp="yes">la|les|li|ho|hi</token>
<token postag="UNKNOWN|_QM_OPEN" postag_regexp="yes"/>
</antipattern>
<antipattern>
<token regexp="yes">la|les</token>
<token regexp="yes">\p{Lu}.*|\d[\d\., ]*|que</token>
</antipattern>
<antipattern>
<token regexp="yes">la|les</token>
<token regexp="yes">de|d'<exception postag="LOC_ADV"/></token>
</antipattern>
<antipattern>
<token>les</token>
<token regexp="yes">altres|unes|tantes</token>
<example>I aquesta pot encendre les altres.</example>
</antipattern>
<antipattern>
<token>te</token>
<token regexp="yes">de|d'</token>
Expand All @@ -51389,6 +51440,10 @@ Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA
<token inflected="yes" regexp="yes">&adjectius_TE_INFUSIO;</token>
<example>Vull prendre te bord</example>
</antipattern>
<antipattern>
<token regexp="yes" inflected="yes">comprar|beure|prendre|comerciar</token>
<token>te</token>
</antipattern>
<rule>
<antipattern>
<token regexp="yes">la|les</token>
Expand Down Expand Up @@ -51423,19 +51478,22 @@ Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA
<pattern>
<marker>
<token postag="V.[MNG].*" postag_regexp="yes"><exception postag="V.[^MNG].*" postag_regexp="yes"/></token>
<token postag_regexp="yes" regexp="yes">lo|la|los|les|ho|hi|me|te|se|li|nos|vos<exception postag="_GN_.*" postag_regexp="yes"/></token>
<token postag_regexp="yes" regexp="yes" case_sensitive="yes">lo|la|los|les|ho|hi|me|te|se|li|nos|vos<exception postag="_GN_.*" postag_regexp="yes"/></token>
</marker>
</pattern>
<message>Hi falta un guionet.</message>
<suggestion>\1-\2</suggestion>
<example correction="Fes-la"><marker>Fes la</marker> tu.</example>
<example correction="Fes-la"><marker>Fes la</marker>.</example>
<example correction="Fes-la"><marker>Fes la</marker> de seguida.</example>
<example correction="mossegar-me">Què tal, petita, encara vols <marker>mossegar me</marker>?</example>
<example>Fes la compra.</example>
<example>Més polseguera van aixecar les altres dues jugades.</example>
<example>Us volem donar les gràcies a tots els assistents.</example>
<example>Van evidenciar la poca sintonia que tenien.</example>
<example>Necessiteu incrementar la vostra presència.</example>
<example>Van anar pujant les tantes escales que hi havia.</example>
<example>Que no ho veieu, tot el que està passant la Xo?</example>
</rule>
<rule>
<pattern>
Expand All @@ -51452,14 +51510,18 @@ Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA
<example>Quan vaig entrar em va preguntar si jo sabia qui era en Marx</example>
<example>En fer-lo girar se'n podia observar</example>
</rule>
<rule default="temp_off">
<rule>
<antipattern>
<token regexp="yes">la|les</token>
<token postag="UNKNOWN|_QM_OPEN" postag_regexp="yes"/>
<!-- és un pronom fort -->
<token inflected="yes">fer</token>
<token>vos</token>
<token regexp="yes">\p{P}</token>
<example>Què és el que feu vos?</example>
</antipattern>
<antipattern>
<token regexp="yes">la|les</token>
<token regexp="yes">\p{Lu}.*|[\d\., ]+</token>
<!-- és un pronom fort -->
<token>vos</token>
<token>?</token>
</antipattern>
<antipattern>
<token regexp="yes">la|les|me|li|lo|nos|vos|los|ho|hi</token>
Expand All @@ -51478,14 +51540,6 @@ Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA
<example>Mireu, remeneu i voteu les 2 que més us interessin!</example>
</rule>
<rule default="temp_off">
<antipattern>
<token regexp="yes">la|les</token>
<token postag="UNKNOWN|_QM_OPEN" postag_regexp="yes"/>
</antipattern>
<antipattern>
<token regexp="yes">la|les</token>
<token regexp="yes">\p{Lu}.*|[\d\., ]+</token>
</antipattern>
<antipattern>
<token regexp="yes">la|les|me|li|lo|nos|vos|los|ho|hi</token>
<token postag="V.[MSI].*|_GV_|&pronom_feble;" postag_regexp="yes"/>
Expand All @@ -51500,6 +51554,7 @@ Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA
<suggestion>\1-\2</suggestion>
<example correction="torna-la">Ara <marker>torna la</marker> a votar.</example>
<example correction="porti-les">Ara <marker>porti les</marker> a cal metge.</example>
<example>Que potser el teu oncle respecta la dels altres?</example>
</rule>
<rule>
<antipattern>
Expand Down Expand Up @@ -51583,8 +51638,8 @@ Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA
<pattern>
<marker>
<token postag="V.[MNG].*" postag_regexp="yes" regexp="yes">.+[aei]</token>
<token regexp="yes">me|te|se|nos|lo|los|ne|ens|l|m|s|t|n|ns</token>
<!-- |els?|en -->
<token regexp="yes" case_sensitive="yes">me|se|nos|lo|los|ne|ens|l|m|s|t|n|ns</token>
<!-- |els?|en |te -->
</marker>
<token><exception postag="P0.*|PP.*|V.[IS].*" postag_regexp="yes"/></token>
</pattern>
Expand All @@ -51601,6 +51656,7 @@ Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA
<example>Porta-l'hi.</example>
<example>Porta-m'ho.</example>
<example>Beure ens porta problemes.</example>
<example>Principalment exporta te, tabac, sucre i llegums.</example>
</rule>
<rule>
<!-- suggeriments més bons -->
Expand Down Expand Up @@ -101241,7 +101297,7 @@ No t'ho explicaré, no cal que em burxis més-->
<example>Immediatament abans de la guerra, se'n va anar del país.</example>
<example>Absolutament tothom pensa això.</example>
</rule>
<rulegroup id="COMMA_LA_QUAL_COSA" name="coma: la qual cosa" default="temp_off">
<rulegroup id="COMMA_LA_QUAL_COSA" name="coma: la qual cosa">
<rule>
<antipattern> </antipattern>
<pattern>
Expand All @@ -101256,19 +101312,36 @@ No t'ho explicaré, no cal que em burxis més-->
<suggestion>\1,</suggestion>
<example correction="aviat,">Ho van fer <marker>aviat</marker> la qual cosa va ser útil.</example>
</rule>
</rulegroup>
<rulegroup id="COMMA_COSA_QUE" name="coma: la qual cosa">
<antipattern>
<token inflected="yes">haver</token>
<token min="0">-hi</token>
<token>cosa</token>
</antipattern>
<antipattern>
<token postag_regexp="yes" postag="A..[FC][SN]."/>
<token min="0" postag="_QM_.*" postag_regexp="yes"/>
<token>cosa</token>
<example>Què seria la «primera» cosa que et compraries?</example>
</antipattern>
<rule>
<pattern>
<marker>
<token><exception regexp="yes">[,;!\?\(&dashes;\.&ellipsis;]</exception><exception postag_regexp="yes" postag="SPS00|LOC_PREP|_QM_OPEN"/></token>
<token><exception regexp="yes">[,;!\?\(&dashes;\.&ellipsis;]|que</exception><exception postag_regexp="yes" postag="SPS00|LOC_PREP|_QM_OPEN"/><exception postag="VS..3S.." postag_regexp="yes"/></token>
</marker>
<token>cosa<exception postag="_GN_FS"/></token>
<token>cosa<exception postag="_GN_FS|LOC_.*" postag_regexp="yes"/></token>
<token>que</token>
</pattern>
<message>Probablement hi falta una coma</message>
<suggestion>\1,</suggestion>
<example correction="aviat,">Ho van fer <marker>aviat</marker> cosa que va ser útil.</example>
<example>Ho van fer una cosa que va ser molt útil.</example>
<example>És una classe de cosa que no es pot interrompre.</example>
<example>no fos cosa que tornés d'ofendre'm</example>
<example>és cosa que a penes ens concerneix</example>
<example>no hi ha cosa que preservi tant d'una caiguda</example>
<example>No era bona cosa que passés això.</example>
</rule>
</rulegroup>
<rulegroup id="COMMA_LOCUTION" name="comes en locucions: per tant">
Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -275,4 +275,5 @@ com una regadera|com una regadora=com un llum|tocat del bolet|sonat|com un llum
le'n=l'en|li'n Apostrofació incorrecta de pronoms febles.
a la volta de la cantonada=a tocar|molt a la vora|a quatre passes|molt a prop Expressió incorrecta.
tan debo|tan debò|tant debo|tant debò|tant de bò|tan de bò|tan de bo=tant de bo
l'enfermetat=la malaltia
l'enfermetat=la malaltia
parau les=paraules|parau-les
Original file line number Diff line number Diff line change
@@ -1,6 +1,8 @@
#Només funciona amb verbs de la primera conjugació, acabats en -ar, que són la majoria
#extendre=estendre #caldria afegir el paradigma verbal
#acometre=escometre|envestir
twittejar|twitejar|twittar|twitar|tweetar=tuitar|piular
retwittejar|retwitejar|retwittar|retwitar|retweetar=retuitar|repiular
torsionar=torçar|tòrcer
complexitzar=complicar|fer complex
aupar=fer upa|aixecar|alçar|ajudar a pujar|ajudar a prosperar
Expand Down

0 comments on commit 83d9446

Please sign in to comment.