できそうだよーーーー

日本語のファイル検索ができそうだよ〜
一時はあきらめかけたができそうである。

# -*- encoding : utf-8 -*-

import re
import codecs
import sys

p = re.compile(sys.argv[1].decode("mbcs"))

stList = codecs.open("text.txt", "r", "sjis").readlines()

count = 0
for line in stList:
    count += 1
    if p.search(line):
        print u"%d行目:%s" % (count, line)

これでコマンドライン引数として<任意の文字列>を与えてやれば、それがファイル中に存在すれば何行目かとその行の内容を表示する。
プロトタイプ1は完成。
これから

  • 複数ファイルに対して
  • いろいろなオプション

を考えていきたいですな。


あ〜、文字コードはうんざりだぜ。
むずいよ。


後で勉強するリスト

  • codecsモジュール
  • encode、decode