2009年06月25日
STATA9:散布図のマークを変える
y1とy2を縦軸、横軸にxをとって散布図にしたとき、
それぞれのマークを○と△に変えたいときは、
scatter y1 y2 x,msymbol(O T)
そのほかのデザインについて、一部抜粋。
丸 O (これは英語のオーの大文字)
ひし形 D
三角 T
四角 S
STATA9:線グラフの調整(過去記事修正)
線グラフの線を、点線やdash(-)へ変える方法。
普通のコマンドだと、
line y1 y2 x
y1とy2のラインのデザインを、普通の線と、点線へ変えたい時は、
line y1 y2 x ,lpattern(solid dot)
とする。
使いやすそうなデザインを4つ抜粋。そのほかにもあり。
普通の線:solid
点線:dot
破線:dash
破線と点(ー・−・):dash_dot
2009年06月23日
TEX:参考文献jbibtexの日本語文献用スタイルファイル
ここでは、natbib.styを使用した場合の方法を説明。
日本語で、経済用に
著者(年数)
で参考文献を表示させるファイルが、
武田史郎 jecon.bst: 経済学用BibTeXスタイルファイル
で配布されている。
ファイル名: jecon.bst
ここのサイトで圧縮ファイルが配布されており、その中の、shift jisというフォルダの中に入っているjecon.bstを使うと、Windowsパソコンでもうまく参考文献を処理することができる。
(圧縮ファイルの中には、同じファイル名のbstファイルが他にもあるので注意が必要)
このファイルを、圧縮フォルダの中にあるpdfファイルの説明書に従ってインストールする。
使い方もpdfファイルに詳しく書いてある。
便利なコマンドだけ抜粋
参考文献のラベルを、ito_oyama_1985とする。
「表示したい参考文献の形式」→コマンド
伊藤・大山(1985)
→\cite{ito_oyama_1985}
(伊藤・大山, 1985)
→\citep{ito_oyama_1985}
伊藤・大山(1985,p.100)
→\citet[p.100]{ito_oyama_1985}
伊藤・大山(1985,p.200参照)
→\citet[p.200 参照]{ito_oyama_1985}
(詳しくは伊藤・大山,1985)
→\citep[詳しくは][]{ito_oyama_1985}
2009年05月22日
STATA9:複数のデータファイルをつなぐ
STATA形式の二つのデータファイル、file1.dtaと、file2.dtaがあったとする。
この二つのファイルを横につなぎ合わせて、別のファイルalldata.dtaを作りたい。
このときは、mergeというコマンドを使えばよい。
use "D:\file1.dta", clear
merge using D:\file2.dta
drop _merge
STATA形式ではないデータを読み込みたいときは、一度STATA形式にデータを保存してから、
上記と同じ作業をすればよい。
たとえば、2つ目のデータファイルがcsv形式のファイルでfile2.csvだったとすると、
insheet using D:\file2.csv
save "D:\file2.dta"
use "D:\file1.dta", clear
merge using D:\file2.dta
drop _merge
save "D:\alldata.dta"
複数のエクセルファイルを一つのSTATAファイルに保存したいとき、この方法を使うと楽。
横方向でなく、縦方向にデータを付け足していくコマンドもある。
また、グループごとにデータを追加するコマンドもある。
2009年04月20日
STATA:グループごとにデータの数を数える
グループごとに含まれているデータの数が違うとき、
その個数を計算したい場合は、
by id:egen num_data=count(id)
num_dataという変数として、id別のデータの数が計算される。
ある変数Xの最大値と最小値を、グループ(id)ごとに出したい場合は、
by id:egen min_X=min(X)
by id:egen max_X=max(X)
として計算できる。
STATA9:複数の変数でソートする
データの並び替えは、一つの変数のときは、sortコマンドで可能だが、
2つ以上の変数でソートしたいこともある。
たとえば、year, month, dayという変数があったとして、
それぞれ、年月が古い順にソートしたいとする。
このとき、
gsort year month day
とすればよい。
また、同じ年月日のデータを1つのグループとして、グループ番号をつけることも可能で、
たとえば、id_timeという変数をグループ番号の変数としたいとすると、
gsort year month day, gen(id_time)
と入力すればよい。
id_timeには、もっとも古い年月日が1で、翌日が2、・・・・という順に番号が振られる。
エクセル:単純作業の記録(マクロ)
エクセル形式のデータファイルがいくつもあり、
データ整理のために同じ作業を何回も繰り返す必要があるとき、
『マクロの自動保存』を利用すると便利です。
これは、エクセル上で普通に作業した工程をエクセルが自動で保存して、
別のファイルで同じことをしてくれます。
プログラムなど覚える必要は無いので、簡単です。
まず、エクセルの『ツール』から『マクロ』→『マクロの自動保存』へいきます。
そうすると、その段階から後の作業をエクセルが記憶してくれます。
詳しくは、『エクセルマクロ塾』
http://kabu-macro.com/kouza/macro/macro_jidoukiroku.html
を参照してください。
シート別とかでもできるかな?
2009年04月17日
EXCEL:日付データの分解
2009/04/01
などのように表示されます。
エクセルのデータを他のソフトへ読み込むとき、これらを年、月、日で3つのデータとして読み込みたいとします。
そのときは、上の日付データの表示形式を、「日付」にします。
上の日付が入っているセルをA1セルだとすると、
=Year(A1)
=month(A1)
=day(A1)
とすることで、年、月、日にちを数字として取り出すことが可能です。
ただし、この上の3つの関数を入力するセルは、セルの書式設定で「標準」を指定してください。
2009年04月09日
STATA9:ネットに落ちているadoファイルを使う方法
そのようなプログラムは、そのままパソコンの中に保存すれば使うことができます。
以下では保存場所を説明します。
まず、保存場所を探すために、STATAに
sysdir
というコマンドを入力します。以下のような表示が現れるはずです。
STATA: C:\Program Files\Stata9\
UPDATES: C:\Program Files\Stata9\ado\updates\
BASE: C:\Program Files\Stata9\ado\base\
SITE: C:\Program Files\Stata9\ado\site\
PLUS: c:\ado\plus\
PERSONAL: c:\ado\personal\
OLDPLACE: c:\ado\
ファイルの場所などは、人によって違うと思いますが、7つのファイル保管場所が出てきます。
このうち、自分で作ったプログラムなどをいれたり、自由に扱うことができるのは、
PERSONAL: c:\ado\personal\
です。「c:\ado\personal\」の部分は人によって違う可能性があります。
ただし、この場所に「personal」という名前のフォルダがないことがあります。
そのときは、自分で作りましょう。
あとは、ファイルの最後にある拡張子が「○○.ado」になっていることを確認して、指定された場所にいれましょう。
STATA9:複数の変数を、一つの表記でまとめる方法
STATAでは、変数名を記入するとき、「*」の記号を使うことができる。
この記号は、たとえば、
xv*
としたばあい、「先頭にxvがつく全ての変数」を表すことになる。
STATAのデータのなかにxv_stock, xv_incomeなどの変数があると
この3つの変数を全てさすことになる。
また、「-」(ハイフン)でつなぐ方法も便利。
たとえば、
x1
x2
stock
x3
x4
income
x5
というように、変数が並んでいたとする。
このとき、
stock-income
と表示すると、これは、
stock x3 x4 income
の3つの変数を表示したのと同じことになる。
ちなみに,この場合に
x*
は、
X1 X2 x3 X4 X5
を表す。
便利な使い方として、たくさんの説明変数をつかって回帰するとき、
説明変数にしたい変数の名前の頭に、
xv_
をつければ、回帰式は
reg stock xv_*
と、簡単に表すことができる。

