Paperless-ngx 是一款开源的文档管理系统,能够将纸质文档转换为可搜索的在线档案,减少纸张使用。内置 OCR 功能,可自动执行 OCR,识别文档中的文字并转换为可编辑和可搜索的文本格式,便于分类、索引和随时搜索查阅。
官方网站 :https://docs.paperless-ngx.com
GitHub 项目地址 :https://github.com/paperless-ngx/paperless-ngx
在线演示 :https://demo.paperless-ngx.com
主要功能
1、组织和索引文档:通过标签、通信者、文档类型等关键信息,能够将文档进行有效的分类和索引。这使得用户可以轻松地找到他们需要的文档,提高了工作效率。
2、执行 OCR:支持对文档执行 OCR,即使是只有图像的文档也能被转化为可搜索和可选择的文本。这项功能为用户提供了更方便的检索体验。
3、支持多种语言:借助开源的 Tesseract 引擎,可以识别超过 100 种语言,确保用户在全球范围内都能够有效地管理多语言文档。
4、文档保存格式:文档以 PDF/ A 格式保存,这种格式专为长期存储而设计,同时保留了未经修改的原始文件,确保文档的完整性和长期可访问性。
5、机器学习自动标记:利用机器学习技术,能自动为文档添加标签、通信者和文档类型,减轻用户手动标注的负担,提高标记的准确性。
6、支持多种文件类型:Paperless-ngx 支持 PDF 文档、图像、纯文本文件、Office 文档(Word、Excel、Powerpoint 及 LibreOffice 等价物)等。
7、直观的 Web 应用:提供直观的 Web 应用,包含定制化仪表板、过滤器、批量编辑、拖放上传、定制化视图、自定义字段、共享公共链接等功能,以满足用户对个性化管理的需求。
8、支持全文搜索:系统支持全文搜索,包括自动完成、相关性排序、高亮显示匹配查询的文档部分等功能。用户可以使用关键词、标签或其他元数据进行搜索,使得查找所需信息变得更加简便。
部署方法
运行以下命令:
bash -c "$(curl -L https://raw.githubusercontent.com/paperless-ngx/paperless-ngx/main/install-paperless-ngx.sh)"
预览图
dashboard 管理面板:
documents-table 文档列表:
文档小卡片显示:
文档大卡片显示:
夜晚暗黑模式:
文件过滤:
文件标签:
并排编辑文档:
移动端: