Nokogiriのchildrenメソッドでpタグの1行を取得する方法

正規表現で行末まで取得ができない場合は、Nokogiriのchildrenメソッドで該当行を探す

こういうNokogiriのElementが存在する。pタグで囲んでテキストの文章を書きながら、<br>で改行をいれていく普通の文章。

取得したい文章は以下の駅名一覧

正規表現で「出発駅」から行末まで取ってくればいいだろうと考えるが、

全部でちゃった(ノω・)

どうもdoc.css("p").first.textとtextメソッドを使うと、HTML中の改行(<br>ではなく、キーボードから打ち込んだ改行)を無視して全ての文章を繋げて一つのtextとするみたい。

なので、おとなしくchildrenメソッドでpの子要素それぞれを見ながら、目的の行を発見したら任意の処理をしてbreakという方法で乗り越えました。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です