SERVICE こんな事ができます

CNTACT ご相談はお気軽に

 ABOUT US こんな会社です



2008/02/14 by ゴウ

正規表現で台詞を抜き取る

ウェブ上にある台詞を抜き取ってみたかったので、正規表現の勉強がてらやってみました。

取りたいのは、「」で囲まれた任意の文字です。

今日新しく覚えたのが、file_get_contents()。

指定したURLのデータをテキストにして持ってきてくれるみたいです。

わーお、便利だな。

で、とってきたデータをpreg_match_all()で解析して、「」の中を取り出します。

指定したURLの中に複数の「」で囲まれた台詞があった場合、ひとつづつ配列に入れていきます。

これがpreg_match()だと、ひとつめの台詞を取った時点で終わります。

よく分からないパターンの書き方

今回は色々試行錯誤した結果、/「(.+?)」/っていうパターンで上手くいきました。

いやー この辺は実際まだよく分からない・・・。

勉強勉強と。