MOTO

PDF データ抽出エンタープライズ v3.04

PDF Data Extractor Enterpriseは、PDFから特定のテキスト情報を抽出できます。PDF形式の請求書から口座番号、氏名、住所などのデータを抽出し、Excel/CSVファイルに出力する必要がある場合、この製品が最適です。水平方向と垂直方向のテキスト位置マッチングに加え、より高度なマッチングのために、例えば…などの条件付きマッチングのためのルールシステムも備えています。

一致は、アカウント名とテキストが同じページにある場合にのみ行われます。異なるフィールドを 1 つに結合することもできます。たとえば、名と姓を 1 つのフィールドとして CSV ファイルに出力できます。さまざまなオプションが用意されています: データ抽出、OCR PDF オプション、OCR 番号修正、傾斜 PDF ページ調整オプション、ヘブライ語などの他の言語ファイルに対する完全な Unicode サポート、右から左への読み取り順序オプション、細断されたスキャンされた PDF を処理するページ上の単語のオフセット、数値、日付、および金額/日付/住所/電子メール/電話番号のフィルタリング、インテリジェントな Adob​​e Reader PDF 強調表示設定、データを使用した出力ファイル名、パターン一致、説明コードを一致させるためのデータファイルの検索、データ列順序の割り当て、コマンドラインでの実行、ヘッダー出力、ページ番号フィールド、ファイル名フィールド、処理するファイルのバッチリスト、32 ビット版と 64 ビット版。

抽出したデータに基づいて、ファイルの名前を変更したり、新しい場所にコピーしたりすることもできます。
また、エンタープライズ エディションでは、ホット フォルダのマルチスレッド監視、NT サービスのバックグラウンド サポート、SQL Server データベース挿入サポート、PDF データからデータベースを直接更新したり、抽出されたデータごとに更新するための追加の DOS コマンドもサポートしており、エンタープライズの完全な柔軟性を実現します。

主な特徴
1. Windows Server 2008、2012、2016、2019、Windows 7、8、10、11 をサポート
2. スタンドアロン バージョンなので、Adobe Acrobat は必要ありません。
3. 32ビット版と64ビット版をダウンロードする
4. 複数ページのPDFからデータを抽出する
5. ソースPDFからの複数の出力フィールド
6. 条件付きマッチングルールシステム
7. オプションの OCR PDF 優先度。
8. 完全な Unicode サポート。
9. ホットフォルダのサポート。
10. NT サービスのバックエンド サポート。
11. SQL Server データベースのサポート。
12. データ用の DOS スクリプトをサポートします。
13. PDFのハイライト設定
14. PDF を細断するためのオフセット オプション。
15. 傾斜した PDF オプション。
16. 番号/日付/金額/メール/電話番号はフィルタリングされていません。
17. 数字/文字のパターンマッチング。
18. ファイルの検索と一致。
19. OCRアルファからデジタル復元へ。
20. 出力フィールド: 合計ページ数、一致するページ番号、ファイル名など。
21. PDFバッチ処理リスト
22. オプションで、自動化のためにコマンド ラインで実行します。
23. 暗号化および保護された PDF を除くすべての PDF タイプをサポートします。
24. 後で使用するために設定を自動的に保存します。
25. インストールプログラム
26. HTML および PDF ヘルプを完備。

更新ログ

v3.04 2023年1月25日
1. オプション「最後の正確なデータが一致する場合、h>=(n) && h<=(n),v>=(n) && v<=(n) 一致出力 (結合 + スペースを追加)」に複数単語のテキスト一致を追加しました。例: 一致テキスト:「Account Number:」は自動的に最後の一致とその前の一致を使用します。スペースを含む最大 3 つの単語を一致対象とすることができます。以前は 1 つの単語に制限されていました。例:「Number:」 2. 32 ビット バージョンでのファイル メニュー ->「名前を付けて保存」のメモリの問題を修正しました。

v3.03 2022年9月9日
1. 'a' アルファのカスタムパターンマッチを更新して、az、AZ をチェックするようにしました。
2. 設定の問題を修正しました。
3. 複数の出力方法で使用できるようにカスタム マッチを更新しました。
4. カスタム部分一致を追加しました。例えば、nn-nnn に一致した場合、12-345 に一致しますが、単語の後ろの任意の部分 (例: 12-345E.1) にも一致します。
5. マルチ出力の制限出力を200から800に変更しました。
6. 英数字のパターンマッチングにXX-XXXを追加しました。
7. 追加フィールドが使用される場合の (multi) および改行の列調整を追加しました。

公式サイト: https://www.traction-software.co.uk/

公式ダウンロード
https://www.traction-software.co.uk/downloads/PDFDataExtractorEnterpriseInstall.exe
https://www.traction-software.co.uk/downloads/PDFDataExtractorEnterpriseinstall64.exe

クラウドドライブからダウンロード(正式版/レジストリファイル)
https://pan.baidu.com/s/1Y2agkAszPEUyiVmwlrDubw?pwd=hhhh 抽出コード: hhhh