全角を見極めるぜ!!・・・って全角と半角の違いは?

今職場の社内システムのリプレイスに携わってますが

他社メーカー製品へのリプレイスなので四苦八苦しております

その中で、データコンバート中なのですが

ここで問題発生!!

データの一部に全角文字が含んでると駄目って事が判明!!

しかし10000件以上あるレコードの中に全角を含んでる物を目視で見つけるのか?

まぁまだテスト中だし突っ込んでエラーが出た物を対策するって暴挙も無いわけでは無いが

件数多かったらエラー処理で泣きたくなるし、何とかしたい

ExcelだったらLENBとLENの差で一発でわかるが職場はOpenOffice・・・

LENBが無いよ・・・これだからマルチバイト圏を考慮しない連中は・・・と悔やんでも仕方ない

 

正規表現で検出出来るみたいで

http://hodade.adam.ne.jp/seiki/page.php?s_zenkaku

これで検索出来たのでとりあえず乗り切るか

 

しかし、OOoでLENBが無いネタを調べてるときにあった

UNICODEやらの文字コードが生まれてきたこの世の中
半角だからバイト数が少ないなんて言い切れるのか?って指摘があって

確かにそれは言い切れないなぁとは思いつつも

 

全角文字はNGってアプリがどう認識しているのかとちょっと気になった

今日この頃