Lua 学習:wget & nkf

2017-06-10 :  PCクリニック
Python、C言語、Perl、グルコサミン、Firefox
前(2017-06-09)の記事「Wget for Windows:クッキー使えた」で書いた如く、
今後の、Web アクセスは wget だ。


それで、Lua ( GSL Shell ) で使うには、
---- test.gsl
os.execute( 'wget http://jn1inl.blog77.fc2.com/ -O kami.html' )
-----

IN=io.open('kami.html'); wstr=IN:read('*a'); IN:close()

----- wstr に対して、処理

と云った感じ。


だが、1つ問題がある。

つまり、'kami.html' ファイルの文字コードが 'UTF-8' である事ダ!
なので、
Lua では、英数字に対してはOKだが、日本語がダメ。

例えば、
  string.find( wstr, '<紙>' )
では、見つからない


・・・・・


2年前(2015-11-15)の記事「Python 学習:nkf 利用」を思い出した。

nkf.exe1つで使える。

なので、
上記コードを書き換えた:
---- test.gsl
os.execute( 'wget http://jn1inl.blog77.fc2.com/ -O kami.html' )
-----
os.execute( 'nkf -s kami.html > kami.txt' )

IN=io.open('kami.txt'); wstr=IN:read('*a'); IN:close()

----- wstr に対して、処理

これで、日本語文字でも扱える。


但し、
string.find()、や string.sub() などを使うとき、
日本語文字は2バイトである ことに留意する必要がある。

これで、完璧???


本日はここまで。


GSL Shell で、Wget for Windows 学習は続く。


見ていただいた序でとは厚かましい限りですが、
お帰りに投票して頂けるとなお嬉しいです。 ⇒ blogram投票ボタン


170504
スポンサーサイト
おきてがみ/blogram
blogram投票ボタン



おきてがみ

最新記事
カレンダー
05 | 2017/06 | 07
- - - - 1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 -
月別アーカイブ
カテゴリ
最新コメント
検索フォーム
リンク
プロフィール

<紙>

Author:<紙>
ようこそ。
「パソコンヲタクの雑記帳」
もろもろなことを綴っています。
パソコン ヲタクってねくら?
画像は kami でなく kani です。

カウンター(fc2、i2i) /Google Analytics


i2i(from 2010-08-24)
Total =
Today  =  
Yesterday=
アンチエイジング

Google Analytics
ブックマーク