|
本帖最后由 como 于 2024-3-5 20:52 编辑
目标:
我正试图让 tesseract OCR 能和 fulltextsearch(elasticsearch) 配合使用以搜索nextcloud网盘图片上的文字。
当前的情况:
我已经能通过elasticsearch检索PDF或word文档内的文字了。然而我搜不到图片里的文字。、
遇到的问题:
我尝试上传新图片来检查,然后用 fulltextsearch:reset后再次fulltextsearch:index,但就是搜不到。
由于 tesseract 不兼容nextcloud 28,我尝试用nextcloud 27.1.7实施上述操作,php 8.1。其他信息:
elasticsearch服务端:
"version" : {
"number" : "8.12.1",
"build_flavor" : "default",
"build_type" : "deb",
"build_hash" : "xxxxxxxxxxxxxx",
"build_date" : "2024-02-01T13:07:13.727175297Z",
"build_snapshot" : false,
"lucene_version" : "9.9.2",
"minimum_wire_compatibility_version" : "7.17.0",
"minimum_index_compatibility_version" : "7.0.0"
},
"tagline" : "You Know, for Search"
}
Nextcloud相关插件版本:
Full text search 27.0.3
Full text search - Elasticsearch Platform 27.0.5
Full text search - Files 27.0.1
Full text search - Files - Tesseract OCR 27.0.0
有谁知道如何在Nextcloud上实现搜索图片上的文字? 求大佬回帖提供思路,能代搭解决该问题必有酬谢,联系TG @GlobalMarkMonitor |
|