Jason Tools 文件工具箱
jt-doc-tools
開源 · 不上雲 · 跑在自己機房

別再把公司文件丟到線上 PDF 工具
這有 27 工具,自架、開源、可控

表單自動填寫、用印與簽名、浮水印、敏感資料去識別化、PDF 加密、中繼資料清除、隱藏內容掃描、差異比對、頁面編輯… 可選 LDAP / AD 認證、角色權限、稽核、記錄轉送。
所有檔案處理只發生在你的伺服器,原始碼公開。

Jason Tools 文件工具箱主介面 — 27 個工具一覽
為什麼要自架?

PDF 處理上傳到線上工具?資料就出去了。

網路上有很多「免費」的 PDF / 圖片 / Office 處理工具:表單填寫、用印、合併、壓縮、簽章、加密…
點兩下很方便,但你的檔案上傳到別人的伺服器。合約、人事、財務、客戶資料、身分證、銀行帳號 — 真的放心?

線上 PDF 工具的隱憂
  • 檔案上傳到第三方伺服器,無法確認何時真的被刪除
  • 多數沒公開原始碼,不知道伺服器端怎麼處理你的資料
  • 免費版常常有隱私政策變更用你的檔案訓練 AI 的條款
  • 身分證 / 銀行帳號 / 客戶名單 / 合約上傳 = 個資法 / GDPR 風險
  • 公司網路稽核看不到、SIEM 收不到,合規無法追溯
  • 跨國 / 跨機房傳輸觸發資料跨境疑慮
地端自架 + 開源 才能安心
  • 檔案永遠不離開你的伺服器 — 沒有第三方 API、沒有 telemetry
  • 原始碼公開(Apache 2.0)— 想稽核什麼都看得到
  • 稽核記錄寫在你的 SQLite,可即時轉發到內部 SIEM (syslog / CEF / GELF)
  • 角色與權限矩陣:誰能用哪個工具,公司能控管
  • 個資法 / GDPR 合規:資料留在自己機房 / 內網
  • 一行指令安裝,跑在公司既有 Linux / macOS / Windows,省授權費
核心功能

27 個工具,分 6 大類

每個工具都有獨立頁面,左側 sidebar 一鍵切換。所有處理結果可下載 PDF 或圖片。

需 Office 引擎的工具會以扳手圖示標示。這些工具在處理 Word / Excel / PowerPoint / ODF 時要用到 OxOfficeLibreOffice(OxOffice 優先,OSSII 維護的台灣本地化 fork,CJK 支援更好)。其餘 21 個工具只處理 PDF,不需 Office 引擎。安裝腳本會自動偵測 / 補裝 OxOffice。

填單與用印

  • 表單自動填寫上傳廠商表單,自動辨識欄位填入公司資料 (Office 輸入時需引擎)
  • 用印與簽名套用印章 / 簽名 / Logo,支援批次與位置微調
  • 浮水印透明度、角度、平鋪填滿或指定位置

檔案編輯

  • PDF 編輯器疊加文字 / 圖片 / 形狀 / 白底遮罩 / 標註
  • PDF 壓縮三段預設或進階自訂 DPI、字型子集化
  • 多頁合併 (N-up)2/4/6/8/9/16 頁合併到一張
  • 檔案合併 / 分拆基本 PDF 操作
  • 轉向 / 頁面整理 / 頁碼排版與編排調整
  • 註解平面化把註解燒進頁面內容,收件方無法移除;表單欄位保留可填

內容擷取

  • 擷取文字輸出 TXT / Markdown / Word / ODT (Word/ODT 輸出需引擎),可選 LLM 重排段落
  • 擷取圖片嵌入圖片自動 dedupe,可勾選下載 ZIP
  • PDF 附件萃取取出 PDF 嵌入的檔案 (EmbeddedFiles)
  • 字數統計總字 / 字元 / 段落 / 句子 + 4 張互動圖表 + CSV/JSON/Markdown 匯出
  • 註解整理擷取 PDF 註解輸出完整清單 / 審閱報告 / 待辦清單(CSV / JSON / Markdown);可依類型 / 作者篩選

格式轉換

  • 文書轉 PDFWord / Excel / PowerPoint / ODF 批次轉 PDF
  • 文書轉圖片每頁轉成 PNG,5 段 DPI 可選 (100 草稿 → 400 印刷)

資安處理

  • 文件去識別化偵測身分證 / 手機 / Email / 統編 / 信用卡 / 帳號…,編修 (Redaction) 或資料遮罩 (Masking) (Office 輸入時需引擎)
  • PDF 密碼保護 / 解除AES-256 加密、權限控制
  • AES 加密壓縮檔多份檔案打包成密碼保護的 zip
  • 中繼資料清除作者 / 標題 / XMP / 修訂歷史 一鍵清空
  • 隱藏內容掃描JavaScript / 嵌入檔 / 隱藏文字 / 外部連結等風險,一鍵清除
  • 文件差異比對兩份文件並排比對 — PDF / Word / Excel / PowerPoint / ODF(Office 自動先轉 PDF)
  • 文字差異比對直接貼兩塊文字立即比對 — 不用上傳,給 log / code / 段落改稿快速 diff
  • 註解清除刪除 PDF 註解,可全部 / 依作者 / 依類型篩選

團隊 / 企業

  • 多領域認證本機 / LDAP / AD,同名帳號可分屬不同領域 (username@realm
  • 角色與權限矩陣 (RBAC)6 內建角色 + 自訂,支援使用者 / 群組 / OU
  • 稽核記錄 + 記錄轉送syslog / CEF / GELF,可接 SIEM
  • API tokens · 字型管理 · 檔案保留完整管理介面
實際畫面

所見即所得

每個工具都是獨立頁面,左側 sidebar 隨時切換。下面是幾個主要工具的真實截圖。

01

表單自動填寫

上傳廠商資料表 / 申請書(PDF / Word / Excel / ODF),系統自動辨識欄位並用公司基本資料填好。一份 profile 對應一家公司,多公司切換無痛。

PDF Word Excel ODF 多公司
表單自動填寫 — 自動辨識欄位並填入公司資料
02

用印與簽名

拖曳定位印章 / 簽名 / Logo 圖片到 PDF,所見即所得。編輯模式即時拖曳、合成模式逐頁預覽(單頁切換 + 上下頁按鈕 + 鍵盤左右鍵)。支援批次處理。

拖曳定位 逐頁預覽 批次 資產管理
用印與簽名 — 拖曳定位印章 + 即時預覽
03

浮水印

圖片或文字浮水印。透明度、角度、尺寸都可調,可平鋪填滿或定位到指定位置。直接寫進頁面 content stream,下游收到 PDF 也無法簡單移除。

圖片浮水印 文字浮水印 平鋪 透明度
浮水印 — 透明度、角度、平鋪
04

文件去識別化

自動偵測身分證 / 手機 / Email / 統編 / 信用卡 / 銀行帳號 / 公司名稱 / 人名等個資。支援兩種處理:編修 (Redaction) — 真正從 PDF 內容流移除,不可還原;資料遮罩 (Masking) — 保留格式但內容遮蔽,方便對外。

個資法 Redaction Masking 8+ 類別
文件去識別化 — 偵測 8 類敏感資料
05

文件去識別化 — 編修結果預覽

承上,文件去識別化偵測完後,可逐筆勾選保留 / 去除每一個敏感欄位,即時預覽編修後效果。輸出可選原始 PDF(真正從內容流移除,不可還原)或遮罩版(保留版面,方便對外文件)。處理過程完全在伺服器本機,敏感資料不外傳任何雲端。

個資法 逐筆控制 即時預覽 不離本機
文件去識別化 — 處理結果預覽
06

PDF 編輯器(輕量、夠用)

定位:輕量、夠用就好,不是 Acrobat 等級的完整編輯器。受 Scribus 啟發的 frame-based 模式:原 PDF 當背景,疊加文字 / 圖片 / 形狀 / 白底遮罩 / 標註,或直接刪除原 PDF 上的文字與圖片。內建字型管理(標準 14 + 思源繁中 + 系統字型 + 自訂上傳)。應付日常蓋章、補字、塗銷、加註綽綽有餘;複雜的版面重排、跨頁 reflow 不在範圍內。

輕量夠用 疊加 刪除原內容 字型管理
PDF 編輯器 — 疊加 / 編輯 / 字型
07

文書轉圖片

把 PDF 或 Office 文件每頁轉成 PNG 圖片。5 段 DPI 可選(100 草稿 → 400 印刷),上傳階段顯示真實 byte 進度,轉完逐頁顯示尺寸與檔案大小,下載 ZIP 預估總容量一眼明瞭。多頁自動打包。

5 段 DPI 真實 % 進度 逐頁大小 ZIP 打包
文書轉圖片 — DPI 選擇與多頁縮圖牆
08

多領域帳號並存

同名帳號可在不同認證來源並存 — 例如 jason@local(救援用)+ jason@ldap(日常登入),各自獨立的角色與權限。來源 badge 顏色區分(local 灰、ldap 藍、ad 紫),管理員一眼分辨。表格欄位可排序,搜尋、來源篩選一應俱全。

同名分屬不同領域 來源 badge 排序 / 篩選
使用者管理 — 同名 jason 在 local + ldap 兩個領域並存
09

權限矩陣 (RBAC)

左側 subject 列表(搜尋 + 全部 / 使用者 / 群組 tab),右側即時編輯角色與工具權限.6 個內建角色(管理員 / 一般使用者 / 文管 / 財務 / 業務 / 法務資安)+ 自訂角色,支援指派到使用者 / 群組 / OU。

RBAC 6 內建角色 使用者 / 群組 / OU
權限矩陣 — RBAC 角色與工具權限
10

字型管理

三層字型來源一站管理:標準 14 字型(PDF 通用相容)+ 內建 CJK 字型(思源黑體 / 宋體繁中)+ 系統字型(runtime 掃描)+ 自訂上傳(公司專用 .ttf / .otf)。預設字型可分別指定給 PDF 編輯器 / 表單填寫 / 浮水印各工具使用。

標準 14 思源繁中 系統字型掃描 自訂上傳
字型管理 — 標準 / 內建 / 系統 / 自訂上傳
企業管理功能

不只是工具集,更是可控管的平台

啟用認證後,企業環境必備的管理能力一次到位(全部開源、無付費版差異)。

A

多領域認證

同時支援 本機帳號 / LDAP / Active Directory。同名帳號可分屬不同領域並存 (jason@local + jason@ldap),登入時於下拉選擇來源。LDAP 設定有「測試伺服器連線」+「測試帳號登入」按鈕,一鍵驗證設定是否正確。

B

角色與權限

6 個內建角色:管理員一般使用者文管財務業務法務資安。可自訂新角色,指派工具使用權限到使用者 / 群組 / OU.in-memory cache 確保權限查詢不影響效能。

C

稽核記錄

登入 / 登出 / 失敗鎖定 / 權限變更 / 設定變更 / 工具呼叫含上傳檔名,全部記下.async 寫入 SQLite (WAL) 不影響服務效能。可篩選 / 匯出 CSV,預設保留 90 天自動清理。

D

記錄轉送

支援三種格式:syslog (RFC 5424 UDP/TCP)、CEF (ArcSight)、GELF (Graylog)。多目的地並行,失敗 retry 3 次後降級為本地稽核事件。可接 Splunk / Graylog / ArcSight / SIEM 系統。

E

上傳檔案記錄

獨立的「上傳檔案記錄」設定頁,列出所有透過工具上傳的檔案 — 誰、什麼時候、用哪個工具、上傳什麼檔名、多大、HTTP 狀態。完整可追溯。

F

檔案保留 / 清理

表單填寫 / 用印簽名 / 浮水印歷史 / 暫存上傳 / Job 結果 / 稽核 各類獨立保留天數設定,排程清理(啟動 + 每 6 小時)。可設「永久保留」(-1)。

不上雲,資料留在自己手中

所有檔案處理只發生在你的伺服器上。
可在 Linux 架站給內網多人使用,或單機本地用,不上傳任何雲端服務

不上雲 檔案永遠不離開你的伺服器,沒有第三方 API、沒有外部分析、沒有 telemetry
資料目錄獨立 所有資料在系統 data/ 區,不跟使用者個人檔案混在一起,也不會 roam (Windows)
稽核可轉發 啟用認證後敏感操作全記下,可即時送到內部 SIEM 做合規稽核
LLM 整合 (持續擴充中) 段落重排、表單欄位輔助辨識等可選擇接入 LLM (Ollama / 本機模型);預設關閉,相關功能持續擴充中
部署

三平台一行指令安裝

需系統管理員權限。安裝過程會自動偵測 / 補裝 OxOffice 或 LibreOffice,下載獨立 Python 環境,註冊系統服務,開機自動啟動。

🏠 單機模式(個人用)
安裝完直接用 — 預設不啟用認證,所有人開瀏覽器到 127.0.0.1:8765 都能用。適合 1 人桌面工作流。
🏢 伺服器模式(團隊 / 企業)
部署到 Linux server,到「認證設定」啟用本機帳號 / LDAP / AD,搭配角色與權限矩陣 + 稽核 + 記錄轉送。內網多人共用,可控管。

預設只聽 127.0.0.1:8765,要對外(內網其他電腦)開放,安裝完跑 jtdt bind 0.0.0.0 即可(會改 systemd / launchd / Windows Service 設定並重啟);要綁特定 port 例 jtdt bind 0.0.0.0:9999。Linux / macOS 前面加 sudo,Windows 以系統管理員身分執行 PowerShell。
Linux Ubuntu / Debian / Fedora 等
curl -fsSL https://raw.githubusercontent.com/jasoncheng7115/jt-doc-tools/main/install.sh | sudo bash
macOS 12+(Apple Silicon)
curl -fsSL https://raw.githubusercontent.com/jasoncheng7115/jt-doc-tools/main/install.sh | sudo bash
Windows
$f="$env:TEMP\jtdt-install.ps1"; try { Invoke-WebRequest 'https://cdn.jsdelivr.net/gh/jasoncheng7115/jt-doc-tools@main/install.ps1' -OutFile $f -UseBasicParsing -TimeoutSec 15 -ErrorAction Stop; powershell -NoProfile -ExecutionPolicy Bypass -File $f } catch { Write-Host "[X] 下載安裝腳本失敗:$($_.Exception.Message)" -ForegroundColor Red; Write-Host "請檢查網路(VPN?防火牆?DNS?)後重試。" -ForegroundColor Yellow }; Read-Host '按 Enter 關閉'
10 / 11(以系統管理員身分執行 PowerShell)

安裝完成後,瀏覽器開 http://127.0.0.1:8765/ 即可使用。

系統需求 最低 Ubuntu 22.04 / macOS 12 / Windows 10 21H2,2 GB RAM,2 GB 硬碟。 不需預裝 Python(uv 自動下載獨立 3.12)。
升級 / 移除
Linux / macOS
sudo jtdt update
sudo jtdt uninstall
Windows(以系統管理員身分執行 PowerShell)
jtdt update
jtdt uninstall
--purge 連同資料一起刪。
反向代理 nginx / Caddy 範例見 GitHub README,三個常見地雷已標註。
免責聲明

使用條款 / Disclaimer

本軟體依「現狀」(AS IS) 提供,不附任何明示或暗示之保證,包含但不限於商業適售性、特定用途之適用性、不侵權之保證。

  • 使用者應自行承擔使用本軟體之全部風險
  • 對於本軟體導致之任何直接、間接、附帶、衍生性或懲罰性損害(含資料毀損、商業中斷、收益損失、商譽損害等),作者與貢獻者概不負責
  • 涉及個人資料、敏感商業文件處理時,使用者應自行確保符合所在地之個人資料保護法、公司資安政策、以及相關法規(含我國個人資料保護法、營業秘密法)
  • 本軟體之 LLM / AI 校驗等功能為選用且預設關閉;若啟用後接外部模型供應商,相關資料傳輸風險由使用者自負
  • 本軟體之輸出結果(如表單自動填寫、去識別化、OCR、LLM 校對)僅供輔助參考,最終正確性仍須由使用者確認;對重要文件請務必對照原檔複核
  • 本軟體與 Adobe、Microsoft、OSSII、TheDocumentFoundation 等任何第三方公司無任何附屬、贊助或背書關係

繼續使用即視為接受上述條款。完整授權見 Apache License 2.0