Stirling-PDF | PDF操作工具
-
介绍 : Stirling PDF是一个使用Docker的强大的、本地托管的基于web的PDF操作工具。它使您能够对PDF文件执行各种操作,包括拆分、合并、转换、重新组织、添加图像、旋转、压缩等。这个本地托管的web应用程序已经发展到包含一套全面的功能,可以满足您的所有PDF要求。
使用docker compose安装
-
确保安装了
docker和docker compose -
创建目录
1
2
3
4
5
6
7
8
9mkdir stirling-pdf
cd stirling-pdf
mkdir StirlingPDF
mkdir StirlingPDF/trainingData
mkdir StirlingPDF/extraConfigs
mkdir StirlingPDF/customFiles
mkdir StirlingPDF/logs
mkdir StirlingPDF/pipeline -
创建
docker-compose.yml1
touch docker-compose.yml
-
编辑
docker-compose.yml1
2
3
4
5
6
7
8
9
10
11
12
13
14
15version: '3.3'
services:
stirling-pdf:
image: docker.stirlingpdf.com/stirlingtools/stirling-pdf:latest
ports:
- '8080:8080'
volumes:
- ./StirlingPDF/trainingData:/usr/share/tessdata # Required for extra OCR languages
- ./StirlingPDF/extraConfigs:/configs
- ./StirlingPDF/customFiles:/customFiles/
- ./StirlingPDF/logs:/logs/
- ./StirlingPDF/pipeline:/pipeline/
environment:
- DISABLE_ADDITIONAL_FEATURES=false
- LANGS=zh_CN -
拉取镜像
1
docker compose pull
-
下载OCR识别模型
1
2
3
4
5
6# 下载中文模型
wget -P ./StirlingPDF/trainingData https://raw.githubusercontent.com/tesseract-ocr/tessdata/refs/heads/main/chi_sim.traineddata
# 下载中文竖版模型
wget -P ./StirlingPDF/trainingData https://raw.githubusercontent.com/tesseract-ocr/tessdata/refs/heads/main/chi_tra_vert.traineddata
# 下载英文模型
wget -P ./StirlingPDF/trainingData https://raw.githubusercontent.com/tesseract-ocr/tessdata/refs/heads/main/eng.traineddata -
启动服务
1
docker compose up -d
-
访问
http://localhost:8080
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 NaClO's Blog!
评论
