ダミーの氏名を生成するスクリプト "namegen.rb"

2010-01-04 12:52 | tag: ,

1520個の姓、1953個の名の組み合わせから約290万通りのダミーの氏名を生成するスクリプトを作りました。ご自由にご利用ください。

試験用データの作成、システム操作マニュアル等で使用するダミーユーザー名などに利用できるかと思います。

姓、名のデータは国内企業約3000社の代表者の氏名から作成しました。芸能人や歴史上の人物の氏名は使っていませんので、違和感の少ない氏名が生成されます。「徳川 漱石」「夏目 家康」などのような誰の目にも目立ってしまうな氏名が生成されることは少ないと思います。

ダウンロード

スクリプト本体

namegen.rb

生成済み氏名

namegen.rbを使って作成したダミーの氏名を格納したテキストファイルです。ツールを実行するのが面倒な方はこちらをご利用ください。重複なしの10000件の氏名を1000件ごとに分割して格納しています。

ファイル1 | ファイル2 | ファイル3 | ファイル4 | ファイル5
ファイル6 | ファイル7 | ファイル8 | ファイル9 | ファイル10

上記ファイル群をまとめたzipファイル: dummy_names.zip

必要な環境

  • 実行にはRubyが必要です。動作確認はRuby 1.8.7で行いました。
  • 文字エンコーディングはutf-8です。Windowsのコマンドプロンプトで実行する場合はshift-jisに変換しなければ文字化けするかもしれません。

使い方

namegen.rbを実行すると、生成した氏名を10個表示します。

$ ruby namegen.rb
牧村 一智
西 満
泉家 雅子
宇根川 純一郎
山岡 秀一
田阪 計泉
湯浅 忠雄
赤谷 徳次
熊城 律次
御手洗 雄良

-c オプションで生成する氏名の個数を指定することができます。

$ ruby namegen.rb -c 5
長畑 孝明
永見 佳代子
養安 晴基
湯川 光弘
神田 進一郎

姓・名データの作成方法

特定業種で抽出した中国地方・近畿地方の企業約3000社の代表者名から作成しました。そのため、女性や若年者の名前が少なめです。