Rubyで日本語扱うあれこれ
良いから世の中のすべての文字コードはUTF-8になればいいと思う。
昨日今日で久々にRubyの勉強始めて、改めて触ってみると今PHPやサクラエディタであくせくしてた諸作業がRubyだと割とわかりやすくシンプルにかけそうなので挑戦したところ
この世で感じるストレスワースト10くらいには入るエンコードのいらいら
# coding:utf-8
これは参考書に載ってたまま使ってるから効果の次第をおわかってないけど
文字コード宣言をしてそう
ただ、これだけだとね、こんなんゆって仕事さぼりよるんですわRubyさん...
invalid byte sequence in Windows-31J
要するに俺の辞書にはWindows-31Jしかねえ死ねボケコラと
英語だともちろんいけるけど、肝心の日本語を認識しない
やからお前の辞書に刻んでやるよ...
Encoding.default_external = 'UTF-8'
UTF-8 is very 最高
これでだいたいおっけーなはず
またエンコード関係で失敗したら追記します。
エンコードじゃないけど、Rubyさんは、”;”こいつを使わない代わりなのか
他の言語でもそうなのか
行末の最後に全角スペースをいれるとエラーになる
ことに気づいたのでメモ
更に
読み込み先のファイルもちゃんとエンコード統一してね
ってことにも気づいた。そらそうか
ほんで、gsub()使って置換するときに、複数パターンを一括で処理するええ方法ないかな~
今のところ
.gsub(/緑/,"green").gsub(/アカ/,"red").gsub(/あお/,"blue") .........
みたいな強引な感じ
ふーむ...