我尝试为tesseract训练语言。我使用Tess4J进行OCR过程。我使用jTessBoxEditor和SerakTesseractTrainer进行训练操作。准备好训练数据后,我将其放在Tesseract/tessdata和Tess4j/tessdata文件夹中。
然后,我设置了这样的新语言:
Tesseract tesseract = new Tesseract();
tesseract.setLanguage("custom");
执行程序后,我收到这个错误:
Error opening data file ./tessdata/custom.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.
Failed loading language 'custom'
Tesseract couldn't load any languages!
我检查我的文件夹;client. traineddata
在tess4j/tessdata和tesseract/tessdata文件夹中。我有其他工作正常的语言。我不知道为什么它找不到新的语言数据?我感谢任何帮助。
我解决了问题:
我必须将client. traineddata
添加到myproject/tessdata文件夹中。添加后,它可以工作。