CSVというファイル形式を知っていますか?
どちらかというと主役ではなく、脇役としていろんなソフトの間でデータをやりとりするときに頑張ってくれる強力な助っ人です。
あのソフトに入っているデータをこっちのソフトでも使いたい、といったときに活躍します。
この記事の目次
CSVはいろんなソフトで使える共通形式
CSV形式は、文字だけで書かれたファイルの一種です。
これをそのまま保存するとWord形式の文書になります。
Word形式の文書をほかのワープロソフト(たとえば一太郎)やExcelでそのまま読み込むことはできませんが、テキスト形式で保存するといちおう読み込むことができるようになります。
ピュアテキスト
このテキスト形式では、最初にWordで指定した文字の大きさ、書体、色などはまったく無視されて、純粋な文字だけが保存されます。そこでこれをピュアテキストと呼んだりします。
CSV形式はこのピュアテキストの一種ですが、中のデータが表の形、言い換えると行と列に並べられています。
Excelで表を作るとき行と列が並んだセルの集まりが表を作っていますが、CSV形式のファイルも表の形にデータを整理して保存しています。
データをカンマで区切る
Excelではデータを一個ずつセルに入れることでデータを区切って表の形を作っているので、見た目がわかりやすいですよね。
CSV形式でも表の形にするためにデータを区切る必要がありますが、セルがないので代わりに半角の,(コンマ/カンマ)を使います。
たとえば次のような感じです。
上の図ではEmEditorというテキストエディタでCSV形式のデータを作成しています。
このように1行の中をカンマでデータを区切り、さらに改行してデータを並べることで表のような形を作ります。これをテキスト形式のファイルに保存したのがCSV形式のファイルです。
CSVは"Comma Separated Value"つまりカンマで区切られた値という意味です。
拡張子をcsvにする
CSV形式ファイルの中身は表の形で表せる文字で、ひとつひとつのデータが半角カンマで区切られていますが、保存の形式としてはピュアテキストファイルです。
なのでさっきの表を保存するとき、フルーツ価格.txtという名前をつけることもできます。
けれどCSV形式であることがもっとはっきり分かるように、csvという拡張子をつけてフルーツ価格.csvのようにするのがふつうです。
先ほどの図で紹介したEmEditorでは、ファイル名を付けて保存するときCSV形式を選べません。
しかし、ファイル形式は通常どおりテキストを選んでおいて、"フルーツ価格.csv"という名前で保存すればそれでCSVファイルになります。
次の図は先ほど保存した"フルーツ価格.csv"をエクスプローラで表示したところです。
私のパソコンではCSV形式のファイルをLibre Office Calcに関連づけしているので、Excel形式の表(記事リスト.xls)と同じアイコンになっています。
ファイルの実体はテキスト形式なのですが、ふつうのテキストファイルとはアイコンが違うのがわかります。
とはいえもともとはテキストファイルなので、いろんなソフトで読み込めます。
ポイント
Windowsパソコンの初期設定では拡張子が表示されません。その場合は設定を変更してください。
-
ファイル管理でぜったい知っておきたい拡張子の基礎知識
オンラインソフトを使ったり、データをバックとき、○○形式のファイルといった説明をすることがあります。この○○形式を表すのが拡張子とよばれるものです。 1クラス上のパソコンユーザーをめざすなら覚えておき ...
続きを見る
この特徴を利用して、ソフト間でデータをやりとりしたり、ソフトそのものを乗り換えてデータだけ引っ越すときなんかによく使われます。
知り合いからデータを分けてもらいたいけど相手が持っているソフトと自分のソフトが違う、といったときに役立ちます。
タブ区切り形式(TSV)
CSVと同じような形式にTSVというもあります。これはデータの区切りにカンマではなくタブ記号を使ったものです。カンマではなくキーボードの【Tab】キーを押すことでデータが区切られます。
CSV形式ファイルを作れるソフト
CSV形式のファイルを作るには、文字の編集ができるソフトが必要です。
逆にいうとメモ帳でもWordPadでも、WordでもExcelでもかまいません。とにかく、文字入力ができるソフトであればなんでもCSV形式のファイルを作れるし、読み込んで表示できます。
ただし、住所データをまとめて入力するような使い方だとそれなりに使い勝手がないとつらいので、テキストエディタか使い慣れた表計算ソフトがいいでしょう。
特に、テキストエディタを使うと表の形に整えたり、いらない文字を削除するテキスト整形の作業が楽になります。
CSVファイルを作るソフト
ワープロ、テキストエディタ、テキスト形式での保存ができるメモソフトなどでCSVファイルを作成できます。
CSV形式を扱えるソフト
年賀状や暑中見舞いの作成に使うはがきの宛名書きソフト、経理や顧客管理などの事務用ソフトでは独自形式でファイルを保存するほかに、CSV形式のファイルを書き出したり、逆に読み込むことができます。
たくさんデータを入力したいとき、入力画面でひとつずつ作業していくよりも、入力・編集が得意なテキストエディタで作成したファイルを一気に読み込んだ方が効率的に作業できるからです。
そのほかには、いままで使ってきたソフトから新しいソフトへ乗り換えでデータを移し替えるようなときにも使います。
有名ソフトどうしであれば、たとえばMicrosoft Excel形式の表はたいていのビジネスソフトや宛名書きソフトで直接読み込めますが、もし直接読み込めないソフトでもCSVで保存しておくことでデータのやりとりが可能になります。
CSVを扱えるソフト
宛名書きや住所録、名刺管理、顧客管理、販売管理、経理などビジネス系ソフトのほとんどはCSV形式の読み書きができます。
中間作業でCSVを使う
専用ソフトで作ったデータをいちどCSVに書き出しておいて、テキストエディタで編集・整形してからもういちど同じソフトに読み込むような使い方もあります。
たとえば、住所録で番地の書き方が"1-2-3"だったり"1-2-3"だったり全角と半角が統一されていなかったり、"1丁目2番3号"、"一丁目2-3"のようにばらばらで入力されていると、検索するときに見落としてしまう可能性があります。ほかにも"-"(半角ハイフン)、"-"(全角ハイフン、"ー"(長音記号)などが混ざっているような場合です。
こういうとき、いちどCSVファイルに書き出し、テキストエディタで一気に整形・編集してから読み込み直せば、データの修正がカンタンです。
そのほかに、文字列検索・置換ツールでもCSV形式を扱えます。これはもともとテキストファイルなんだから当然ですね。
CSV形式で扱えないもの
ふつうのパソコンユーザーがCSV形式データを扱う場合、いちばん身近で使いやすいのはやはりMicrosoft Excelでしょう。
しかしExcelで作った表の場合、計算式や文字の色、大きさ、太字や下線などの装飾、それからグラフや図形などはCSV形式に保存できません。
要するに、表のいちばん基本である文字だけ保存することができます。
またExcelのワークシート内には、複数のタブを作って何枚ものシートを入れることができますが、CSVファイルにはこれをぜんぶ保存することはできません。タブ(シート)1枚をひとつのCSVファイルに保存することになります。
まとめると、表の形に整理して並べることができる文字をなんの装飾もしないで保存するのがCSV形式ということです。
CSV形式を表計算ソフトで読み込む
CSV形式で書かれたファイル"フルーツ価格.csv"をMicrosoft Office互換の表計算ソフトLibre Office Calcで読み込んでみましょう。
次の図は"ファイルを開く"ダイアログボックスです。
Libre Office Calcの標準ファイル形式は*.odsですがここではファイル形式選択オプションが"すべてのファイル"になっているので、テキストやCSV形式から画像ファイルであるPNG形式まで全部表示されています。
実際に"フルーツ価格.csv"を開こうとすると次のようなインポート画面が出てきます。
これは、標準ファイル形式以外のファイルを読み込もうとしているので、その形式を正しく認識させるためのものです。
重要なのが区切りのオプションというところです。
次の記号で区切られたフィールドというオプションが選択されていて、タブ、コンマ、セミコロンの3つがオンになっています。
フィールドとはカンタンにいうとセルのことで、タブ、コンマ、セミコロンのどれかで区切られているデータがあったら、それを1個1個のデータと判断してそれぞれのセルに振り分けるという意味です。
これによってコンマ(カンマ)で区切られているCSV形式ファイルを正しく読み込めることになります。
もし”コンマ"のところのチェックがオフだったら、正しく読み込んでくれません。
正しく認識できるといちばん下のところにこんな形で読み込みますよというプレビューが表示されます。
実際に読み込んだところが次の図です。
なお、インポート設定画面ではプレビューに正しく文字が表示されないことがあります。そんなときはいちばん上にある文字エンコーディングをチェックしてみましょう。
Windowsパソコンで普通に作ったCSVファイルなら、文字エンコーディングのところを"日本語(Shift-JIS)”にするか、または"Unicode(UTF-8)"を選んでやればだいたい正しく表示できるはずです。
ワークシートをCSV形式で保存する
こんどは逆にLibre Office Calcで作ったワークシートをCSV形式で保存してみましょう。
次の図では、売上金額のセルに計算式が入っている上に、円記号や桁区切りのカンマが入っています。また列見出しの文字サイズが大きく、セル内で中央揃えになっていたり、罫線が引かれています。
これをCSV形式で保存してみましょう。
[名前を付けて保存]ダイアログボックスの"ファイルの種類"で「テキストCSV(*.csv)」を選んでファイルを保存します。
すると次のようなエクスポート設定のダイアログボックスが現れます。
ここでの注目はフィールドの区切り記号です。初期設定ではここがカンマになっているので、カンマ区切り形式つまりCSV形式で保存されることになります。
CSV形式で扱えるのは文字データだけなので、罫線や文字の太さ、文字サイズなどは完全に省いて保存されます。
また、先ほどのエクスポートオプションではでは"セルの内容を表示どおりに保存"というオプションにチェックが入っているので売上金額のところの円記号や桁区切りのカンマまでそのまま保存されます。
このオプションをオフにすると、円記号とカンマを省いて数値だけ保存します。
"計算結果の代わりにセルの数式を保存"をオンにすると数式が保存されますが、この数式は=B2*C2のような文字に置き換えられます。
CSVが分かればデータのやりとりは自由自在
このようにCSV形式を使うことで、住所録や集計表のようなデータであればどんなアプリケーションとでもデータのやりとりが可能になります。
古いソフトに残っていたデータを新しいソフトに移し替えるようなばあい、新しいソフトのほうが古いソフトのデータ形式をサポートしていればカンタンに移し替えができますが、もしサポートしていなくても**CSV形式での保存ならまず間違いなく可能ですから、いちばん基本となる文字データだけは確実に受け渡しできます。
ぜひ覚えておいてください。
CSV形式のまとめ
- 装飾のない文字データだけをカンマで区切って表形式にする
- ピュアテキストまたはCSV形式で保存、拡張子をcsvにする
- いろんなソフト間でのデータのやりとりに使う