Review preprocessing of text lines #54

mikegerber · 2021-01-25T17:10:00Z

Private email from @andbue to @kba, copied with permission:

Was ich dann noch bedenklich finde, ist, dass die Zeilenbilder nicht durch den Standard-MultiDataProcessor laufen. Ich überblicke nicht ganz, was workspace.image_from_segment alles tut, aber Calamari skaliert, normalisiert, padded (16px weiß) und lässt die Daten durch einen CenterNormalizer wie beim guten alten Ocropus laufen. Meine eigene Erfahrung ist, dass der Output nur dann optimal ist, wenn bei der Prediction das gleiche Preprocessing verwendet wird wie im Training. Wie gesagt, ich übrblicke image_from_segment gerade nicht, aber vielleicht solltet ihr da mal einen Blick hinein werfen. Als Beispiel, wie man den Standard-Preprocessor einbauen könnte, verlinke ich mal meinen Code aus dem Client:
Instantiierung des DataPreprocessors (line 426-436):

https://github.com/andbue/nashi/blob/dd533d193264472a4cfc96aab69fadd9ca52732c/ocr/nashi_ocr/nashi_client.py#L426

Verwendung:

https://github.com/andbue/nashi/blob/dd533d193264472a4cfc96aab69fadd9ca52732c/ocr/nashi_ocr/nashi_client.py#L211

mikegerber added the bug Something isn't working label Jan 25, 2021

mikegerber self-assigned this Jan 25, 2021

mikegerber added the question Further information is requested label Jan 25, 2021

mikegerber mentioned this issue Mar 2, 2021

Calamari 2.2 #61

Open

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Review preprocessing of text lines #54

Review preprocessing of text lines #54

mikegerber commented Jan 25, 2021 •

edited

Loading

Review preprocessing of text lines #54

Review preprocessing of text lines #54

Comments

mikegerber commented Jan 25, 2021 • edited Loading

mikegerber commented Jan 25, 2021 •

edited

Loading