TITLE:JavaScriptでHtmlのtable要素をCSVに変換する

Posted by at

JavaScriptでHtmlのtable要素をCSVに変換する

概要

Html<table>要素をCSV(character-separated values)に変換するBookmarkletです。colspanrowspanで結合するセルがある場合は、同文字列を挿入しています。

  • 区切り文字はタブ(TSV)
  • ブックマークレットなどに登録して表(<table>要素)のあるページで実行
  • <table>要素をダブルクリックすると、その内容をCSVに変換して<textarea>に文字列として挿入
    • 子要素に<table>が存在する場合は、ダブルクリックに反応しない
  • <textarea>をダブルクリックすると、元の<table>に戻る
  • <thead><tfoot>の扱いは適当(例えば、<tbody>の前にある<tfoot>が、そのまま先の行としてCSVになる)
  • <capthion>は無視
  • <colgroup>span属性には未対応

ソースコード

Bookmarklet

  • 名前(任意)
    • table2csv
  • アドレス(YUI Compressorで圧縮)
    javascript:(function(){function f(t){var q=t.getElementsByTagName("tr"),n,m,s,r,u,h,p=[],o=q.length,g;for(n=0;n<o;n++){if(p[n]==null){p[n]=[]}u=q.item(n).cells;g=u.length;for(m=0;m<g;m++){h=u.item(m);r=h.innerHTML.replace(/<.*?>/mg,"").replace(/\t/g," ").replace(/(^\s+)|(\s+$)/g,"").replace(/\"/,'""');s=0;while(p[n][m+s]!=null){s++}p[n][m+s]=r;for(k=1;k<h.colSpan;k++){p[n][m+s+k]=r}for(l=1;l<h.rowSpan;l++){if(p[n+l]==null){p[n+l]=[]}for(k=0;k<h.colSpan;k++){p[n+l][m+s+k]=r}}}}return e(p)}function e(o){var m=o.length,n=o[0].length,h="",j,i,g;for(i=0;i<m;i++){j="";for(g=0;g<n;g++){j+='\t"'+o[i][g]+'"'}if(j!=""){j=j.substring(1,j.length)}h+=j+"\n"}return h}var d=function(h){var g=document.createElement("textarea");g.value=f(this);g.style.width="80%";g.style.height="240px";g.originalTable=this;this.tx=g;this.parentNode.replaceChild(this.tx,this);g.addEventListener("dblclick",function(i){this.parentNode.replaceChild(this.originalTable,this)},false)},c=document.getElementsByTagName("table"),b=0,a=c.length;for(;b<a;b++){if(c[b].getElementsByTagName("table").length>0){continue}c[b].addEventListener("dblclick",d,false)}}());
  • アドレス(テスト用にtable2csv.user.jsを読み込む)
    javascript:(function(){var s=document.createElement('script');s.charset='UTF-8';s.src='http://terai.xrea.jp/data/javascript/table2csv.user.js?'+(new Date()).getTime();document.body.appendChild(s)}());
  • アドレス(テスト用にtable2csv.min.jsを読み込む)
    javascript:(function(){var s=document.createElement('script');s.charset='UTF-8';s.src='http://terai.xrea.jp/data/javascript/table2csv.min.js?'+(new Date()).getTime();document.body.appendChild(s)}());

ユーザースクリプト、拡張機能

  • FireFox
    • Greasmonkeyなどのユーザースクリプトとしてtable2csv.user.jsをドロップして追加
  • Chormeなど
    • dev版などで拡張機能タブにtable2csv.user.jsをドロップして追加

テスト用table

  • rowspan, colspan
    • Bookmarkletを実行、または拡張機能として追加した後、以下の表をダブルクリックするとCSV文字列に変換
      ABCD
      123
      456
      7
"A"	"B"	"C"	"D"
"1"	"2"	"3"	"3"
"4"	"5"	"5"	"6"
"7"	"5"	"5"	"6"
  • footer
    ファイル数サイズ総行数コメント行実行数空行数コメント率
    footer
    合計1695291916174370770458480412521
    平均3131310314555017444.13%

参考リンク

コメント

  • 表計算ソフトなどの場合は、<table>タグをコピペするだけでspanを考慮した表の取込みが出来るので、このスクリプトを使ってCSV,TSVに変換して読み込む意味はあまりないかも。ただ、自分の使いたいソフトには、Htmlでの<table>取り込み機能がないが、csvを読み込んで表にする機能があり、また連続する同文字列セルの結合が可能なので作成してみました。取り込み作業は終わったのでもう必要ないけど、せっかくなので公開しておきます。 -- aterai
  • innerTextではなくinnerHTML.replace(/<.*?>/mg, "")を使用して、FireFoxでも動作するように修正。 -- aterai
  • @version 1.0.3: セル中改行などに対応。 -- aterai
  • 非常に有用そうなものを公開していただき有難う御座います。Firefox20で本ブックマークレットの実行を試みた所、「アドレス(YUI Compressorで圧縮) 」のコードをコピーしてブックマークに登録しようとしたら、登録自体ができませんでした。「アドレス(テスト用にtable2csv.jsを読み込む) 」はブックマークに登録出来ましたが、本ページで実行しても何も起こりませんでした。使用方法が間違っているでしょうか? -- ななしさん
    • 報告どうもありがとうございます。「アドレス(YUI Compressorで圧縮) 」は、先頭にjavascript:が必要なのに書き忘れていました(修正しました)。「アドレス(テスト用にtable2csv.jsを読み込む) 」はFireFox21.0などでは正常に動作しているようです。ブックマークレットを実行したあとで、表をダブルクリックしても何も起こらないのでしょうか? -- aterai
  • すみません、間違って二重投稿してしまいました。表をダブルクリックしなければ動かない、ということが理解出来ていませんでした。。。今動作確認しました所、どちらも動作しました。このブックマークレットを使い、銀行の使用履歴を簡単にコピペ出来ればと思っていましたが、実現出来そうです。ありがとうございました。 -- ななしさん
  • 何度も再送信してしまい、大変失礼しました。失礼を承知でもう1つご教示頂きたいのですが、現在のスクリプトではブラウザ画面に""で括られたCSV形式で出力になっていますが、表に貼り付ける様にクリップボードへデータをコピーするようにカスタマイズするには、どのような変更を加えればよいでしょうか?もしよろしければご教示頂けると幸いです。 -- ななしさん
    • 重複と思われるコメントを削除しました。カスタマイズですが、""で括らない形式にしたいということでしょうか?大抵の表計算ソフトならテキストの区切り記号を自動認識して除去してくれると思います。「アドレス(YUI Compressor で圧縮) 」を変更するなら、'\t"'+o[i][g]+'"''\t'+o[i][g]に変更すればとりあえずは動作するような気がします。 -- aterai
  • 説明が悪くて申し訳ありません。表をダブルクリックするだけで、表示されている表の中のデータをクリップボードへコピーするようにしたいのです。もしよろしければご教示お願いします。 -- ななしさん
    • おはようございます。セキュリティの問題で、最近のブラウザではスクリプトからのクリップボードアクセスは許可されていないようです。ブラウザの設定で変更できるのかもしれませんが(未調査)、あまりオススメできません。 -- aterai
  • そうだったのですか。。。承知しました。素晴らしいスクリプトを公開していただいた上、ご説明まで頂きありがとうございました。 -- ななしさん