收到警告时如何解决问题而不必安装tesseract 3.03:
警告:您正在运行不受支持的Tesseract版本。预期版本为3.03,您的版本为:3.02.02打开数据文件/usr/local/share/tessdata/lus.traineddata时出错,请确保将TESSDATA_PREFIX环境变量设置为“ tessdata”目录的父目录。加载语言'lus'失败Tesseract无法加载任何语言!分段故障(核心已转储)
收到警告时如何解决问题而不必安装tesseract 3.03:
警告:您正在运行不受支持的Tesseract版本。预期版本为3.03,您的版本为:3.02.02打开数据文件/usr/local/share/tessdata/lus.traineddata时出错,请确保将TESSDATA_PREFIX环境变量设置为“ tessdata”目录的父目录。加载语言'lus'失败Tesseract无法加载任何语言!分段故障(核心已转储)
Answers:
检查软件包是否已安装
dpkg -l | grep tesseract
使用软件包安装teseract
sudo apt install tesseract-ocr
搜索/安装可用的相关软件包
apt search tesseract | grep -B1 language
使用有效的ISO 639-2(三个字母)语言代码。
tesseract image.png -l spa myoutput
会产生 myoutput.txt
pdfsandwich -verbose -lang spa -layout single scanned.pdf