Copytables は Web ページからの表形式データの抽出を簡素化します

Copytables は Web ページからの表形式データの抽出を簡素化します

Webでは、表は至る所で使われています。多くのサイトが、その裏で書式設定に表を利用していることに、あなたは気づいていないかもしれません。表はコンテンツの配置や列形式のデータの表示に便利ですが、表からデータを抽出する必要がある場合、非常に手間取ることがあります。オープンソースのCopytables を手に入れてからは、データを抽出したいという欲求がかなり強くなりました。私はArc、Brave、Google Chromeで無料のCopytables Chrome拡張機能を使用していますが、Firefox用のCopytables (Chrome版からフォーク)やSafari用のCopytables(Mac App Storeで2.99ドル)もダウンロードできます。私はまだ試していません。

Copytables で何が実現できるか、一例を挙げてご紹介します。今週初め、ボランティア管理ツール Helper Helper から募集案件のリストを誰かにメールで送りたいと考えていました。Copytables を使わずに Web アプリのインターフェースで表からテキストを抽出するには、表全体(左下)を選択し、コピーして BBEdit に貼り付ける必要がありました(右下)。BBEdit での結果も、これまで見てきた表に比べればそれほどひどいものではありませんが、それでも行を 1 行おきに削除する必要がありました。表が小さい場合はこれで済むかもしれませんが、行数が数百行に及んだり、改行でデータがきれいに分割されなかったりしたらどうなるでしょうか。

コピーテーブルなしでテーブルを選択する

ArcのCopytablesでは、Optionキーを押してセル選択モードに入り、左端の列のセルをドラッグして選択することができました(左下)。これをコピーしてBBEditに貼り付けると、まさに望んでいた結果が得られました(右下)。

コピーテーブルでセルを選択する

もう一つ例を挙げましょう。ここ数週間、スパムボットとの熾烈な戦いを繰り広げてきましたが、その中で最も効果的だった暫定的な防御策の一つがIPアドレス範囲のブロックです。Copytablesを使えば、WordPressセキュリティプラグインのログから数百ものIPアドレスを素早く抽出できます。列の内容を選択するには、Command + Optionキーを押しながら列ヘッダーをクリックします。その後、データをBBEditにコピーして操作するのは簡単です。隣接していないセルなど、不連続な選択範囲も作成できます。

コピーテーブルで列を選択する

Copytables では、行やテーブル全体を選択することもできます。これらの機能はあまり使われておらず、デフォルトのキーボードショートカットさえありません。そのため、必要な場合は、Copytables ウィンドウを開き (Arc では拡張機能メニューから、Brave や Google Chrome では固定された拡張機能ツールバーアイコンをクリックして開きます)、行またはテーブルをクリックして関連するキャプチャモードを有効にしてから、クリックして選択します。キャプチャボタンを使用する場合は、完了したら必ず無効にしてください。そうしないと、Copytables がクリックをキャプチャするため、一部の Web アプリが正しく動作しなくなります。テーブル全体をより速く選択するには、検索行の前のテーブルまたは次のテーブルボタンをクリックします。 

コピーテーブルウィンドウ

上部にあるコピーオプションについては、もう少し説明が必要です。私はまだ使っていませんが、コピーしたデータの形式を様々な選択肢から選ぶことができ、中には便利なものもあるかもしれません(特に列と行を入れ替えるオプションが気に入っています)。理論的には、これらのオプションのいずれかを「編集」>「コピー」のデフォルトとして設定することもできますが、私の簡単なテストではうまくいきませんでした。Copytablesインターフェースのボタンを使うのが賢明です。

  • そのまま:画面に表示されている表をそのままコピーします
  • プレーンテーブル:書式設定なしでテーブルをコピーします
  • テキスト:タブ区切りテキストとしてコピー
  • テキスト+スワップ:タブ区切りのテキストとしてコピーし、列と行を入れ替えます
  • CSV:カンマ区切りのテキストとしてコピー
  • CSV+Swap:カンマ区切りのテキストとしてコピーし、列と行を入れ替えます
  • HTML+CSS:書式付きHTMLソースとしてコピー
  • HTML:書式設定なしで HTML ソースとしてコピーします
  • テキスタイル:テキスタイルとしてコピー(テキストコンテンツ)
  • Textile+HTML: Textile (HTML コンテンツ) としてコピー

Copytablesには、私が時々便利だと感じるもう一つの便利な機能があります。それは、情報ボックスです。これは、現在選択しているセルに関する情報を表示するインセットボックスです。2000年から2021年までのカナダの山火事に関するデータの表を考えてみましょう。「Area Burned(焼失面積)」列の内容を選択すると、Copytablesは上部に青い情報ボックスを表示し、選択したセルの数をカウントし、合計と平均を計算し、最小値と最大値を表示します。これらのシンプルな計算により、データをスプレッドシートに移動する必要がなくなります。

コピーテーブル情報ボックスを表示

インフォボックスが邪魔になる場合は、オフにするか、Copytables でウィンドウの別の場所に表示するように設定できます。この設定やその他の設定にアクセスするには、Copytables ウィンドウの「オプション」リンクをクリックします。最も便利な設定は、クリック&ドラッグ選択の修飾キー(下記参照)です。システム上の他の設定と競合する場合は、これらの設定を調整することをお勧めします。Copytables ウィンドウには、「キーボードショートカット」リンクもあり、拡張機能のキーボードショートカットをブラウザ全体で設定できます。Copytables のオプションは、ウィンドウ内の「検索」ボタンと「キャプチャ」ボタンに対応しています。

コピーテーブル修飾キー

Copytables は無料ですが、役に立つと思われる場合は、私と一緒に作者のGeorg Barikin に寄付することができます。

Idfte
Contributing writer at Idfte. Passionate about sharing knowledge and keeping readers informed.