FC2ブログ

PDFファイルの種類

2020-08-12 :  PCクリニック
PDFファイルには、大きく分けて2種類ある?

4ヶ月前(2020-04-01)の記事:
PDF の文字列がコピー出来ない!」で書いた、

  「WindowsパソコンでPDFのテキスト文字がコピーできない時の解決法
  にある如く、
  3.PDFファイルがそもそも文字データではない

つまり、「PDFファイル」には、
“文字データ”のものと“画像データ”のものがある。

“文字データ”のものとは、
例えば、
 「LibreOffice/Writer」で、
  文書を「Export」→「PDF」でエクスポートしたもの
とか、
 「Kinza」で、「印刷」→「PDFに保存」で印刷したもの
とかですね。

一方、
“画像データ”のものとは、上記参照記事の如く、
  PDFファイルがスキャナで取り込んだものである場合、
  テキストコピーはできません。
よくあるパターンとして、
  印刷した書類をそのままコピー機などでPDF化したものは、
  テキストコピーの対象外になってしまいます。

と云うことですね。


それで、
細かく分けると、(“画像データ”のものをよく見ると)2つに分けられる?

2ヶ月前(2020-06-24)の記事:
RealReader Pro Standard 設定手順図」で書いている、

「RealReader Pro Standard」の保存フォーマットの1つ:
“PDF(透明テキスト)形式”
がある。

つまり、
単に“画像データ”のみでなく、それに重ねて“透明テキスト”が存在するもの。



ところが、最近もう1つ異なる形式の“PDFファイル”に遭遇した。

これは、
「RealReader Pro Standard」で“読み込み”=“画像を開く”で、
当該“PDFファイル”を開いても、
一部の、本当(?)の“画像データ”部分のみしか取り込めない???

また、
4ヶ月前(2020-04-22)の記事:
Windows 版 PDFimages を導入」で書いた、
“PDFimages”でも読み込め無い:結果は同じ。


だが、
なんと<紙>にとっては、「RealReader Pro Standard」に次ぐツール:
読取革命 Ver.15」では、
キチント、ページ毎の画像データとして取り込めた!



「RealReader Pro Standard」と、「読取革命 Ver.15」とでは、
このような“PDFファイル”に対しては「読取革命 Ver.15」の入力機能が勝る。

「読取革命 Ver.15」を[かんたんモード]にして、
 [入力]→[画像ファイル]で“PDFファイル”を指定。
 [保存]→[画像]→「TIFFファイル」で“すべてのページ”で保存。

結果の1つの“TIFFファイル”を元の“PDFファイルの”代わりとして、
「RealReader Pro Standard」で取り込む。

これが最高!の手順ダ。



本日はここまで。


見ていただいた序でとは厚かましい限りですが、
お帰りに投票して頂けるとなお嬉しいです。 ⇒

200723
関連記事
スポンサーサイト



コメントの投稿

管理者にだけ表示を許可する

人気blog Ranking



最新記事
カレンダー
07 | 2021/08 | 09
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31 - - - -
月別アーカイブ
カテゴリ
最新コメント
検索フォーム
リンク
プロフィール

<紙>

Author:<紙>
ようこそ。
「パソコンヲタクの雑記帳」
もろもろなことを綴っています。
パソコン ヲタクってねくら?
画像は kami でなく kani です。

FC2 / i2i / Google




Google Analytics
ブックマーク