iOS 7のリリース直後(2013年9月18日の記事「iOS 7 事前チェックリスト」参照)、Smile Software は新しいiOSアプリ「PDFpen Scan+」(4.99ドル)をリリースしました。このアプリを使えば、iPadやiPhoneをドキュメントスキャナーとして使えます。デバイス内蔵のカメラを使って直接ドキュメントをスキャンすることもできます(アプリには専用のカメラインターフェースが用意されています)。また、デバイス内の写真コレクションから画像を選択することも可能です。
はい、「画像」と言いましたが、PDFpen Scan+を使えば複数の画像を1つの複数ページの文書にまとめることができます。できあがったPDFは、SmileのiPad/iPhone用PDFpen、またはiCloud、Dropbox、Evernote、Google Docs、Alfresco、Boxなどのクラウドサービスで簡単に共有できます。また、ページエッジ検出機能と16言語に対応するOCR(光学式文字認識)機能も搭載しています。
もちろん、理論上は素晴らしいように聞こえます。しかし、PDFpen Scan+は実際にはどのように機能するのでしょうか?実際に試してみたところ、純粋な画像スキャナーとしては十分に機能することがわかりましたが、OCR機能には改良の余地が大いにあります。
PDFpen Scan+ でスキャンする— たとえば、iPhone で初めて PDFpen Scan+ を起動すると、ドキュメント画面が表示され、その下部に一連のシンプルなボタンが表示されます。カメラ ボタン (ドキュメントを撮影して PDF に変換)、画像ボタン (写真コレクションに保存されている画像から PDF を作成)、追加ボタン (Evernote や Dropbox などの他のソースから PDF または画像のコピーをインポート) です。
カメラボタンをタップして、PDF化したい文書の写真を撮ります。インターフェースはシンプルですが、iOS 7では場違いに見える古いiOS 6風のシャッターボタンが使われています。しかし、それは見た目の問題に過ぎません。真の問題は、テキスト文書を鮮明できれいな写真にするためにカメラを静止させるのが非常に難しいことです。Smileは、息を吐き出して体が最も静止しているときに撮影することを推奨しています。各写真は承認または拒否でき、画面
左上の数字ボタンをタップして、文書を1枚の画像で構成するか複数の画像で構成するかを指定できます。
ベストショットを撮影したら、エッジ設定画面が表示されます。暗い背景で紙の文書を撮影した場合、自動エッジ検出は非常にうまく機能しますが、明るくコントラストの低い背景では、それほどうまく機能しません。自動エッジ検出がうまく機能しない場合や、画像の一部だけをキャプチャしたい場合は、ドラッグ可能なコーナーコントロールポイントを使用して、含める画像領域を簡単に指定できます。この画面で画像全体を指定したり、
最終的な文書の用紙サイズを設定したり (デフォルトは US レター)、画像を破棄して再試行したりすることもできます。エッジを設定したときに作成された選択領域が長方形ではなく台形に近い場合 (文書を少し傾けて撮影した場合によくある問題)、切り取られた領域は長方形に収まるように適切に拡大縮小され、遠近法効果が排除されることに注意してください。
端が整えられたら、次に画像自体の画質を調整します。画面下部のコントロールを使って、画像の向きを修正し、明るさとコントラストを調整します。これらの最後のコントロールを調整することで、ページの背景に対してテキストが可能な限り読みやすくなり、
影ができる限り目立たなくなります。
最後に、画像を可能な限りきれいに仕上げたら、OCRを実行するかページを追加するかを選択できる画面が表示されます。OCRを実行するには、「OCR」ボタンをタップし、表示されるメニューから「OCR Document」をタップするだけです。OCR処理自体はそれほど速くはありません。PDFpen Scan+が解釈すべきテキストを識別すると、ページ画像上に黄色のバーが表示されます。この段階が完了すると、
PDFに目に見えないテキストレイヤーを追加する前に、結果の解析に少し時間(1~2分ほど)を費やします。
PDFpen Scan+ の性能は? — 残念ながら、OCR 機能は特に賢くも寛容でもありません。例えば、2 段組みのページを全く理解できないため、ページ上のすべてのテキストが読み込まれるとしても、OCR メニューから「文書テキストをコピー」を選択すると、通常の散文というよりはエズラ・パウンドが酔っ払って作った詩のような、寄せ集めのテキストが読み込まれてしまいます。また、人間の目には問題なく読めるように見えるテキストでも、OCR は簡単に読み取れなくなってしまいます。例えば、この記事のためにスキャンした 2 段組みのページから抽出したテキストの冒頭部分を以下に示します。
The real-estate to and respond with. lt distracts the user from his task, nml
it the chances for the device being dropped.
how much ml estate is esme
. devices. In the iPhOne has the least
the iPzd the moa ThlS not
account display which may be another
costly. it takes tesoumes to create. display. and
inletfau- views; time to design and test the
code. On the other hand. sticking to a single
simplifies design and cuts down
lllllt‘
テキスト画像が非常に高品質であっても、OCRは奇妙な動作をすることがあります。例えば、第3世代iPadでiBooksにある小説のページのスクリーンショットを撮り、OCRテストに使用しました。PDFpen Scan+はほぼすべての単語を正しく認識しましたが、時々、不可解なことにテキストの行が入れ替わってしまい、メモアプリにコピーしたときに順序が狂って表示されることがありました。
しかし、テキストを含む他の画像も非常に優れた解読能力を発揮します。例えば、週末にサンタモニカ空港の航空博物館で展示看板を撮影し、その一部をPDFpen Scan+に渡して解析してみました。
結果として得られた翻訳は実際にはかなり良好で、いくつかの間違いがあり、時々単語が抜けているだけでした。
North Amencan
The North American F-86 Sabre (sometimes called the Sabrejet) was a
transonic jet fighter aircraft. The is best known as America's first
swept wing fighter which could counter the similarly-winged Soviet
MiG-15 in high speed dogfights. The was produced as both a fighter-
intereeptor and fighter-bomber. Although developed in the late 1940s and
outdated by the end of the 1950s, the Sabre proved versatile and adapt-
able, and continued as a front-line fighter in numerous air forces.
The F-86 Sabre was the first American aircraft to take advantage of flig ht re-
search data seized from the German aerodynamicists at the end of the war.
Use of a swept wing would solve their speed a slat on the
wing's leading edge which extended at low speeds would enhance low-
speed stability. Its success led to an extended production run of more than
7,800 aircraft between 1949 and i956, by far the most-produced Western
jet fighter.
About this Aircraft
This is an F-86H model that is currently undergoing restoration and will be
finished with a California Air National Guard livery andis onloan from the
National Museum of Naval Aviation.
結論:PDFpen Scan+は、カバーと独自の光源を備えた安定したフラットベッドスキャナーとは対照的に、手ブレや自然光といった条件で画像を取得する必要があることを考慮すると、まずまずの仕事をこなします。実際、ポケットに収まるデバイスで生成された画像がこれほど優れていることに驚いています。正直なところ、外出中に紙の文書を素早くPDF化する必要がある場合、これより簡単かつ安価な方法は思いつきません。さらに、PDFpen Scan+はiPhoneおよびiPad用のSmileのPDFpenアプリと緊密に統合されているため、作成したPDFに注釈やマークアップを簡単に追加できます。
同時に、OCRの結果はかなりばらつきがあり、期待外れになることも多々あります(たまに思わず笑ってしまうこともありますが)。外出先で高品質なOCRを必要とする本格的な出張族にお勧めするには、もう少し改善が見られることを期待します。しかし、普段使いであれば全く問題ありません。次回美術館に行く際には、ぜひ使ってみようと思っています!