Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Update remote-rule-filters.xml #10004

Merged
merged 1 commit into from
Dec 29, 2023
Merged

Update remote-rule-filters.xml #10004

merged 1 commit into from
Dec 29, 2023

Conversation

BellaDiekmann
Copy link
Collaborator

@BellaDiekmann BellaDiekmann commented Dec 28, 2023

Fix loop COMA_SUJETO_PREDICADO/AI_ES_HYDRA_LEO_MISSING_COMMA

Intenté solucionar el problema del loop COMA_SUJETO_PREDICADO/AI_ES_HYDRA_LEO_MISSING_COMMA.
@Jaume: La sintaxis que tú me mandaste no funciona para frases con sustantivo + adjetivo(s)("Esta discusión bizantina está...") y provoca un mensaje de error:

rg.languagetool.rules.patterns.PatternRuleTest$PatternRuleTestFailure: Test failure for rule AI_ES_HYDRA_LEO_MISSING_COMMA[1] in file /org/languagetool/rules/es/remote-rule-filters.xml (line 142): "Esta discusión bizantina está siempre presente."
Errors expected: 1
Errors found   : 0
Message: 
Analyzed token readings: [/SENT_START*] Esta[este/DD0FS0*,Esta/_GN_FS*,Esta/_GN_FS*]  [ /null*] discusión[discusión/NCFS000,discusión/_GN_FS,discusión/_GN_FS,discusión/_GN_FS]  [ /null*] bizantina[bizantino/AQ0FS0,bizantina/_GN_FS,bizantina/_GN_FS,bizantina/ignore_concordance]  [ /null*] está[estar/VAIP3S0,estar/VAM02S0]  [ /null*] siempre[siempre/RG,siempre/RG_before]  [ /null*] presente[presente/AQ0CS0,presente/I,presente/NCMS000,presentar/VMM03S0,presentar/VMSP1S0,presentar/VMSP3S0] .[./SENT_END*,./_PUNCT*]
Matches: []

Experimenté con la sintaxis y parece que el problema es min="0" max="3". Lo solucioné añadiendo varios subrules, pero es muy largo. ¿Hay otra manera de solucionarlo?

Tampoco sé si min y max causan problemas en los antipatterns. El SpanishRemoteRuleFilterTest no encontró más errores en mi sintaxis, pero no sé si se puede confiar en él para los antipatterns.

Otro problema que he tenido: en la última subrule de COMA_SUJETO_PREDICADO no puedo mover el marker a la izquiera porque esto significaría marcar el SENT_START, lo que provoca una advertencia del test.

Fix loop COMA_SUJETO_PREDICADO/AI_ES_HYDRA_LEO_MISSING_COMMA
@jaumeortola
Copy link
Member

Experimenté con la sintaxis y parece que el problema es min="0" max="3". Lo solucioné añadiendo varios subrules, pero es muy largo. ¿Hay otra manera de solucionarlo?

Me imaginé que podía pasar esto. No tengo una solución. Con las reglas que tenemos aquí, ¿se cubren todos los casos más relevantes?

@BellaDiekmann
Copy link
Collaborator Author

BellaDiekmann commented Dec 29, 2023

Experimenté con la sintaxis y parece que el problema es min="0" max="3". Lo solucioné añadiendo varios subrules, pero es muy largo. ¿Hay otra manera de solucionarlo?

Me imaginé que podía pasar esto. No tengo una solución. Con las reglas que tenemos aquí, ¿se cubren todos los casos más relevantes?

Eso espero. ¿Sabes si los min y max también causan problemas en los antipatterns que añadí al rulegroup y si se puede mover el marker a la izquierda en la última subrule?

Copy link
Member

@jaumeortola jaumeortola left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

After the merge, we can check if the loop disappears in production.

@BellaDiekmann BellaDiekmann merged commit c093868 into master Dec 29, 2023
1 check passed
@BellaDiekmann BellaDiekmann deleted the test_es_fix_loop branch December 29, 2023 08:30
@jaumeortola
Copy link
Member

It works! Many commas between subject and verb disappear, but there are some more FPs. Can they be caused by the new antipatterns?
https://internal1.languagetool.org/regression-tests/via-http/2023-12-29/es/result_java_AI_ES_HYDRA_LEO_MISSING_COMMA.html

@BellaDiekmann
Copy link
Collaborator Author

It works! Many commas between subject and verb disappear, but there are some more FPs. Can they be caused by the new antipatterns? https://internal1.languagetool.org/regression-tests/via-http/2023-12-29/es/result_java_AI_ES_HYDRA_LEO_MISSING_COMMA.html

That's good news. The sentences for which we observed the loop were removed. It's likely that the new FPs are caused by the antipatterns. I'll have a look at it.

@jaumeortola
Copy link
Member

These changes fixed some (or most?) new FPs: 2c7cc37

@BellaDiekmann
Copy link
Collaborator Author

These changes fixed some (or most?) new FPs: 2c7cc37

Thank you for fixing it! So can we mark these loops as closed in the issue ? Or should we wait until Premium is deployed?

@jaumeortola
Copy link
Member

So can we mark these loops as closed in the issue ?

Yes

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

2 participants